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PRÓLOGO 


El presente libro es el producto de los apuntes de clases dictado en 
diversas Instituciones de educación superior a lo largo de varios años, 
teniendo como pre-requlsltos el curso de matemática básica. 

El objetivo de esta obra es presentar métodos y procedimientos para el 
análisis de datos cuando estos por su naturaleza presentan 
¡ncertldumbre en la toma de decisión. 

El libro consta de 10 capítulos, acompañados de ejercicios resueltos y 
propuestos con la aplicación del SPSS. 


Esperamos que el presente texto de consulta sirva de guía al 
estudiante o Investigador, para comprender los métodos que usa esta 
disciplina para analizar datos. 


LOS AUTORES 
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CAPÍTULO 1 


INTRODUCCIÓN 

Este primer CAPÍTULO tiene por objeto presentar algunos conceptos 
básicos de estadística, asi como de sumatorias simples y dobles los 
cuales se van a utilizar para una mejor comprensión de los capítulos 
siguientes. 

CONCEPTOS BÁSICOS DE ESTADÍSTICA Y SUMATORIAS 

1.1. ESTADÍSTICA 


Es una ciencia que proporciona métodos y procedimientos para 
el análisis de datos, cuando éstos por su naturaleza presenta 
incertidumbre en la toma de decisión. 

Otras definiciones: 

Es una matemática aplicada para el análisis de datos. 

Es el estudio de los fenómenos aleatorios. 

Es la ciencia que se encarga de la recolección, ordenamiento, 
representación, análisis e interpretación de datos generados en 
una investigación sobre hechos, individuos o grupos de los 
mismos, para deducir de ello conclusiones precisas o 
estimaciones futuras (Salazar, Castillo, 2018, p. 13). 


1.2. RAMAS DE LA ESTADÍSTICA 

La estadística se divide en dos ramas: 
• ESTADÍSTICA DESCRIPTIVA 


Es parte de la estadística que consiste en la recolección, 
organización, presentación, análisis e interpretación de un 
conjunto de datos para una o más variables de interés del 
investigador. 
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Es la ciencia mediante la cual se recopila, organiza, presenta, 
analiza e interpreta datos de manera informativa tal que describa 
fácil y rápidamente las características esenciales de dichos datos 
mediante el empleo de diversos métodos gráficos, tabulares o 
numéricos, etc. (Suarez, 2018, p.13). 

• ESTADÍSTICA INFERENCIA!, 


Es parte de la estadística que se encarga en tomar decisiones 
sobre el comportamiento de una variable de interés definida en la 
población en estudio; utilizando para tal objetivo una muestra al 
azar. Es decir a partir de los resultados obtenidos al procesar los 
datos de una muestra, se generaliza los resultados de dicha 
variable en la población, con un cierto riesgo que es medido por 
la teoría de la probabilidad. La estadística inferencial proporciona 
métodos y procedimientos para el análisis de datos. 

Llamada también inferencia estadística, la cual consiste en llegar 
a obtener conclusiones o generalizaciones de la población a 
partir de una muestra de ella, es decir, emplea métodos para 
buscar información que permita determinar propiedades de la 
población basándose en el estudio de los datos de una muestra 
tomada a partir de ella (Suarez, 2018, p. 13), 

1.3. CONCEPTOS BÁSICOS 


1.3.1. Población 

Es la totalidad de unidades elementales (personas, 
animales u objetos) sujeto a estudio y que poseen una 
característica común; al tamaño de la población (número 
de unidades elementales) se simboliza con la letra 
mayúscula “N”. Una población en estudio puede ser finita 
(se pueden enumerar sus elementos) o infinita (no se 
pueden enumerar sus elementos). 

Ejemplos : 

a. Todas las tiendas que se dedican a la venta de gas en el 
distrito de la Molina (N = 650) 

b. Todos los establos de ganado vacuno en el departamento 
de Cajamarca (N =1,350) 
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c. Todos los Alumnos matriculados en el semestre 2000-11, 
en laUNMSM. 

d. Todos los Cadetes de la Escuela de Oficiales de la PNP, 
en proceso de formación. 

e. Todas las papeletas Impuestas por la PNP, por Infringir al 
Reglamento Nacional de Tránsito, durante el mes de 
diciembre de un año determinado (N = 2,520). 

f. Todos los usuarios que concurren a la Biblioteca de Letras 
y Ciencias Humanas de la UNMSM, un día cualquiera. (N 
= 1,742) 

g. Todas las estrellas del universo. 

1.3.2. Unidad Elemental 


Es cada uno de los elementos que conforman la población 
en estudios, de la cual se requiere Información. En una 
unidad elemental se definen muchas variables de Interés 
para el Investigador. 

Ejemplo 

De los ejemplos anteriores de poblaciones se tienen las 
siguientes unidades elementales: 

a. Una tienda que se dedican a la venta de gas en el distrito 
de la Molina. 

b. Un establo de ganado vacuno en el departamento de 
Cajamarca. 

c. Un alumno matriculado en el semestre 2000-11, en la 
UNMSM. 

d. Un Cadete de la Escuela de Oficiales de la PNP, en 
proceso de formación en el año 2004. 

e. Una papeleta impuesta por Infringir al Reglamento 
Nacional de Tránsito Impuestas por la Policía en el mes de 
Setiembre. 

f. Un usuario que concurre a la Biblioteca de Letras y 
Ciencias Humanas de la UNMSM, un día cualquiera. 

g. Una estrella del universo. 

1.3.3. Dato u observación 


Es el valor (atributo, conteo o medición) que toma la 
variable de Interés en la unidad elemental. 
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Los valores que toma una variable en particular X , se 
representan con letras minúsculas acompañadas por 
subíndice; es decir, 



■^i = valor que toma la variable X en la i-éslma observación 


1.3.4. Variable 

Es una característica de Interés que se desea estudiar en 
la unidad elemental. La variable en estudios la fija el 
Investigador; el valor que toma la variable (dato u 
observación) cambia de unidad elemental a otra. A una 
variable se le simboliza con las últimas letras del 
abecedario, tales como X, Y, Z, o también letras 
mayúsculas acompañada con subíndice, tales como: 



Ejemplos de variables en estudio: 

1.7. X = Montos(S/.) por venta diaria de contenidos de balones de 
gas. 

1.8. Y = Numero de ganado vacuno por establos 

1.9. Z = Color de los ojos de los Cadetes de la EO-PNP 

1.10. W= Volumen (cm 3 ) de contenido de liquido de una botella. 

1.11. T =T¡empo (minutos) que permanece un usuario en un cajero 
automático. 

1.3.5. Tipos de variables : 

De acuerdo a los valores que toma la variable en estudio, se 
clasifican en: 

• Variable Cualitativa 

Cuando los valores que toma la variable en estudio provienen 
de una cualidad o atributo, se divide a su vez en nominal y 
jerárquica (ordinal). 
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• Variable Cualitativa Nominal. 


Una variable se considera cualitativa nominal, cuando con los 
valores que toma esta variable no es posible establecer un 
orden de acuerdo a su importancia. 

Ejemplos : 

a. X = Color de los ojos de los alumnos de la Facultad de 
Letras y Ciencias Humanas de la Universidad Nacional 
Mayor de San Marcos (marrones, pardos, verdes, 
negros,...) 

b. Y = Preferencias a determinadas marcas de jabones de 
tocador por las alumnas de la facultad de Letras y 
Ciencias Humanas de la Universidad Nacional Mayor de 
San Marcos. 

c. Z = Sexo de los Cadetes de la EO-PNP. 

• Variable Cualitativa Jerárquica u Ordinal 

Una variable se considera cualitativa jerárquica u ordinal, 
cuando con los valores que toma la variable en estudio es 
posible establecer un orden de acuerdo a su Importancia 
(ascendentemente o descendentemente) 

Ejemplos : 

a. X = Grados Académicos de los docentes de la Facultad de 
Ingeniería de Sistema de la Universidad Nacional Mayor 
de San Marcos: bachiller, magíster, doctor, Ph.D. 

b. Y = Grados del personal de Oficiales de la Policía Nacional 
del Perú: Teniente General, General, Coronel, 
Comandante, Mayor, Capitán, Teniente, Alférez. 

c. Z = Clase social: alta, media, baja 

• Variable cuantitativa 

Los valores que toma la variable provienen de un conteo o de 
una medición (instrumento de medida: metro, balanza, 
cronómetro, termómetro, etc.); se divide a su vez en: 

• Variable cuantitativa Discreta 

Una variable se considera cuantitativa discreta cuando los 
valores que toma la variable provienen de un conteo. También 
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se dice que los valores que toma esta variable están asociados 
a los números enteros. 

Ejemplos : 

a. Y = Número de hijos por familia. 

b. Z = Número de alumnos matriculados por cursos, en la 
Universidad 

Nacional Mayor de San Marcos en el ll-Semestre 
2003. 

c. W =Número de accidentes de tránsitos registrados 
diariamente en el distrito de Miraflores, durante una 
semana cualquiera. 

d. T = Número de artículos publicados en las revistas 

científicas de biología, durante los últimos 10 

años. 

e. P= Número de veces que frecuentan los usuarios durante 
la semana a la biblioteca Central de la UNMSM 

• Variable cuantitativa continua 


Una variable se considera cuantitativa continua, cuando los 
valores que toma la variable provienen de una medición; es 
decir, los valores que toma se encuentran en un intervalo. 
También se dice que los valores que toma esta variable están 
asociados a los números reales. 

Ejemplos: 

a. X = Montos (S/.) por ventas diarias por los grifos en el 
distrito de la Molina. 

b. Y = Edad (años) de los alumnos matriculados en el 
Semestre Académico 2004-11 en la Universidad Nacional 
Mayor de San Marcos. 

c. Z = Tiempo de vida (horas) de baterías para automóviles. 

d. Y = Estatura (mts) de los Cadetes de la EO-PNP. 
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Variables 


VARIABLES CATEGORICAS 


VARIABLES NUMERICAS 



CUALITATIVAS 


NOMINAL 

Género Estado Civil 
Soltero 


Masculino 

Femenino 


Casado 

Conviviente 


Primaria 

Secundaria 

Superior 


Leve 

Moderado 

Severo 


CUANTITATIVAS 


ORDINAL 

Instrucción Intensidad 


INTERVALO 

Temperatura Hora del día 


-10°C 

0°C 

20°C 


00 Horas 
10 Horas 
20 Horas 


OO.OOKg 
10.24Kg 
20.00Kg 


Uno 

Dos 

Tres 


Dicotómicas: Tienen solamente dos categorías 
Ejemplos de Ordinal Dicotómica: 

Nuevo - Continuador 
Vivo-Fallecido 
Sano—Enfermo 

Politómicas: Tienen más de dos categorías. 

Fuente: Apuntes de clase Supo(2020) 


Continuas: Provienen de medir 

Se pueden representar con números enteros o fraccionarios 
Entre dos valores siempre existe un valor intermedio 

Discretas: Provienen de contar 

Solamente pueden ser representados con números enteros 


1.3.6. Muestra 


Es una parte de la población en estudio o también se dice 
que es un subconjunto de unidades elementales de la 
población. Al tamaño de la muestra se le representa con la 
letra minúscula “n”. Se dice que una muestra es aleatoria o 
al azar, cuando todos los elementos de la población tienen 
la misma probabilidad de ser parte de la muestra. 

Muestreo, es el procedimiento para obtener una muestra 
representativa de la población en estudio. 

1.3.7. Parámetro 

Es un valor fijo que caracteriza a la variable de Interés en la 
población en estudio. Para calcular este valor se requiere 
conocer todos los datos de la variable en la población; por 
lo general este valor casi nunca se conoce el objetivo de 
Investigador es estimarlo a través de una muestra 
aleatoria. 


Los parámetros más utilizados son: 


1. La media aritmética poblaclonal (ju) 

2. La mediana poblaclonal (Me) 

3. La moda Poblaclonal (Mo) 
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4. La media Geométrica Poblacional (ju g ) 

5. La media Armónica Poblacional {¡u a) 

6. La variancia Poblacional (a 2 ) 

7. La desviación Estándar Poblacional (cr) 

8. El coeficiente de variación Poblacional ( CV ) 

9. La proporción Poblacional ( P ) 

10. El rango poblacional ( R ) 

1.3.8. Valor Estadístico o estimado . 

Es un valor calculado con los datos de la muestra aleatoria 
y se supone estima al valor del parámetro de la variable en 
estudio en la población. Este valor cambia de una muestra 
a otra muestra. La fórmula que permite calcular el valor 
estadístico recibe el nombre de estimador o estadística. 

Los valores estadísticos más utilizados son: 

a. La media aritmética muestral ( x) 

b. La mediana muestral (m e ) 

c. La moda muestral (m 0 ) 

d. La media geométrica muestral (x g ) 

e. La media armónica muestral ( x a ) 

f. La variancia muestral (s 2 ) 

g. La desviación estándar muestral (s) 

h. El coeficiente de variación muestral (cv) 

i. La proporción muestral ( p ) 

j. El rango muestral (r) 


1.4. Ejercicios resueltos 
Eiemplo-1 

En Lima Metropolitana se toma una muestra aleatoria de 30 grifos que 
se dedican a la venta de combustible de un día determinado, se obtiene 
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que el monto por venta promedio es de S/. 12,600.50. Con esta 
Información Identificar: población, unidad elemental, variable en 
estudio, tipo de variable, un posible dato, tamaño de la muestra, 
parámetro y valor estadístico. 


Solución: 

Población 
Metropolitana, que 

combustible. 

Unidad elemental 
Metropolitana que se 


Todos los grifos de Lima 
se dedican a la venta de 
Cada grifo de Lima 
dedica a la venta de 


combustible 
Variable en estudio 
combustible 
Tipo de variable 
Dato u observación 
Tamaño de la muestra 
Parámetro 


Valor estadístico 


Monto por venta(S/.) diariade 

Variable cuantitativa continua 
S/12,400.30 
30 grifos 

No se conoce el monto 
promedio por venta diaria 
en la población. 

S/.12,600.50, venta promedio 
en la muestra. 


E¡emplo-2 

De una población de 2,042 revistas científicas de biología, el 73.46% 
están escritas en idioma inglés. Una muestra aleatoria de 50 revistas 
arroja que el 72.0% están escritas en inglés; el promedio de artículos 
por revistas es de 12.4. Con esta información identificar: población, 
unidad elemental, variables en estudios, tipos de variables, posibles 
datos, tamaño de la muestra, parámetro y estimado o valor estadístico. 


Solución: 


Población : 

Todas las revistas científicas 

de biología 

N = 2,042. 

Unidad elemental : 

Cada revista científica de 
biología. 

Tamaño de la muestra 

50 revistas científicas de 
biología 


19 





EsTADÍSTICa DESCRiptiva V pRoBABILIDAd pARa LAS CIENCIAS DE LA INFORMAciÓn CON El USO DEl SPSS 


Variables 
en estudio 

Tipos de 
variables 

Datos u 

observación 

es 

Parámetro 

Valor 

estadístico 
o estimado 

Idioma de 
las revistas 
científicas 

Cualitativa 

nominal 

Español, 

ingles, 

portugués, 

etc. 

73.46%, 
están en 
idioma ingles 

72.0%, 
están en 
idioma 
ingles 

Números 
de artículos 
por revistas 

Cuantitativ 
a discreta 

12, 16, 11, 

9, etc. 

Se 

desconoce 

12.4 

promedio 
del número 
de artículos 
por revistas 


1.5. Ejercicios propuestos 

En cada uno de los siguientes enunciados identificar de ser posible: la 
población, unidad elemental, variables en estudio, tipos de variables, 
tamaño de la muestra, valores estadísticos, parámetros y un ejemplo 
de posibles datos en cada caso: 

1. Una muestra al azar de 50 recién nacidos en la maternidad de 
Lima arroja un peso promedio de 3.50 Kg; el 46% son varones y 
70% tuvieron parto normal. 

2. Una muestra aleatoria de 550 peruanos mayores de 18 años 
arroja la siguiente información: la edad promedio es 32 
años;20% tienen grado de instrucción superior y 30% está de 
acuerdo con las medidas económicas anunciadas por el 
gobierno hace unos días. 

3. Para analizar la posibilidad de lanzar al mercado una nueva 
marca de cigarrillos, se efectuó una encuesta entre fumadores 
que transitaron por la quinta cuadra de la avenida Canadá entre 
las 5 p.m. y 8 p.m. del día 14 de febrero; para ello se seleccionó 
en forma aleatoria a 80 fumadores, obteniéndose los siguientes 
resultados: el 25 % prefiere los cigarrillos importados que los 
nacionales y el precio promedio que pagan al comprar una 
cajetilla es de S/. 3.40. 

4. Una muestra aleatoria de 100 microbuses de transporte urbano 
en Lima metropolitana a las 12.00 horas de un día cualquiera, 
arroja que el promedio de pasajeros dentro del microbús es de 
18.4 personas; el 75% de los microbuses tienen más de 10 años 
de antigüedad. 

5. Una muestra aleatoria de 50 frascos conteniendo mermelada 
arroja un peso promedio de 45.3 grs. Y una desviación estándar 
de 5.436 grs. Si la producción diaria de la planta es de 5,000 
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frascos con un peso promedio de 45.5 grs y una desviación 
estándar de 5.5 grs. 

6. El porcentaje de varones de un centro educativo es de 62.5%; 
una muestra aleatoria de 50 alumnos arroja que 58% son 
varones; la edad promedio es de 15.4 años; el promedio de 
hermanos es de 2.3 y el 60% tienen casa propia. 

7. Una muestra aleatoria de 70 usuarios que concurren a un centro 
de información arroja que el 34.3% son del sexo masculino. De 
experiencias pasadas se sabe que el porcentaje de varones que 
concurren fue de 34.2%. 

8. Una muestra aleatoria de 20 revistas científicas sobre Biología 
arroja que el promedio de artículos publicados es de 13.3; el 
70% están escritos en inglés; el 15% son de nacionalidad 
Argentina. 

9. De una población de 1,200 actas de sustentación en 
Matemáticas Pura, el 72% obtuvo el calificativo de bueno al 
sustentarlo. Una muestra aleatoria de 25 actas arroja que el 76% 
de actas obtuvieron el calificativo de bueno. 

10. Una muestra al azar de 65 Cadetes de la Escuela de Oficiales de 
la Policía Nacional del Perú arroja los siguientes resultados: El 
78.4% son de sexo masculino; el 32% cursa el 2do año 
académico; el 80% provienen de colegios particulares; el gasto 
promedio semanal en los cafetines es de 30.4 nuevos soles; el 
promedio de hermanos es de 2.4; la edad promedio es de 23.4 
años y su estatura promedio es de 1.69 mts. 

11. Una muestra al azar de 0 estudiante de la Facultad de letras y 
ciencias Humanas de la UNMSM arroja la siguiente Información: 
el 30% tienen edades superiores a los 30 años; el 52% son de 
sexo masculino; el promedio de créditos matriculados es de 
21.4; la edad promedio es de 23.3 años; el promedio de cursos 
llevados es de 5.2; el 32% de sus profesores tienen grado de 
Magister. 

1.6. ETAPAS DEL MÉTODO ESTADÍSTICO 

La estadística, proporciona métodos y procedimientos que 
permiten analizar datos de variables de interés, utilizando para tal 
fin una muestra elegida al azar de la población en estudio; con el 
objetivo de tomar decisiones en dicha población. Para su 
aplicación, se debe tener en cuenta las siguientes etapas: 

1.6.1. Planteamiento del problema. 
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Debe plantearse con precisión y claridad la necesidad 
que se desea conocer, las causas de la Investigación. 

1.6.2. Objetivo 

Conjunto de acciones o tareas de las necesidades 
alcanzadas, debe plantearse un objetivo general y 
como mínimo tres objetivos específicos. 

1.6.3. Determinación de la unidad de Investigación 

Corresponde al elemento de la población, que puede 
ser persona, animal u objeto, de la cual se definen 
variable de Interés para el Investigador. 

1.6.4. Formulación de hipótesis 

Son supuestos que se plantea en la población con 
respecto a la distribución o parámetro de la variable de 
Interés, estos pueden ser rechazado o no, utilizando 
para tal propósito una muestra aleatoria. 

1.6.5. Selección del método de Investigación 

La Investigación puede ser exploratorio, descriptivo, 
correlaciona!, etc. 

1.6.6. Recopilación de datos. 

Corresponde a la recolección de datos. Esta puede ser 
por observación directa, por encuesta, por 
publicaciones y/o fuentes externas confiables. El éxito 
de toda Investigación depende en gran parte de la 
consistencia de los datos obtenidos. 

1.6.7. Procesamiento de los datos 

Corresponde a obtener tablas, gráficos o valores 
estadísticos, en la actualidad se usan software tales: 
Excel, Mlnltab, SPSS, SAS, etc. 

1.6.8. Publicación 

Se consigna los resultados de la Investigación, previa 
revisión de los datos procesados. 

1.6.9. Generalización e Inferencia estadística. 

Las conclusiones de la Investigación son generalizadas 
a la población de donde se obtuvo la muestra aleatoria. 
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1.7. SUMATORIAS SIMPLES. DOBLES Y NOTACION PUNTUAL 

1.7.1. SUMATORIAS SIMPLES 

Sea X, una variable cuantitativa en estudio que toma valores 


x¡, x 2 x n 


, la suma de los valores 


+X n 


, se 


Z 


representa mediante el operador matemático M que significa 

X 

sumar todos los valores ', para "i" que toma valores enteros 
positivos consecutivos desde 1 hasta n; es decir: 


c l +x 2 +,...,+x n =Y J x ¡ 


i= 1 


Donde: 


%i ~~ Valor que toma la variable X , en la i-éslma observación 


Ejemplos : 

1. Desarrollar de las siguientes sumatorias 

5 

Z *2ífl = *3 + *5 + ”- + *ll 


/=! 


X 


7 7 7 

2 = X + X + ... + X 

2 í 2 4 12 


i= 1 
4 


2 x i+i _ 2 x 2 + 2x 3 _|_ ^ 


¿=i y2¡+i y 3 y s 


2x 5 

y 9 


Y J (x i - V) 2 = (T , - 7) 2 + (X 2 - 7) 2 + ... + (x 5 - If 

!=1 


2. Supongamos que una variable X , toma los siguientes valores: 

x l —l x 2 = 9 x 3 = 5 x 4 = 6 
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4 2x 2 + 3 


Calcular 


:Z 


«=i x-2 


2x ¿ +3 2x + 3 2x ¿ +3 2x ¿ +3 2* 2 +3 

_J i _ U 1 i Ü 2 i U 3 i Ü 4 


x 

i=l x¡ - 2 x¡ — 2 x 2 - 2 x 3 - 2 x 4 - 2 


4 2r 2 + 3 2(7) 2 + 3 2(9) 2 + 3 2(5) 2 + 3 2(6) 2 + 3 


fe 


+ 


+ 


+ 


y 

tí x-2 1 -2 9-2 5 -2 6-2 




20.2 + 23.57 +17.67 +18.75 = 80.19 

¿=i x-2 

3. Supongamos que una variable X toma los siguientes valores: 

x l = —2 x 2 ~ 1 x 3 - -4 x 4 — 3 

4 

Calcular: y, (x, +2y 

i= 1 

y ( x¡ + 2) 2 = (x 3 + 2)~ + (x 2 + 2)" + (x 3 + 2)~ + (x 3 + 2)~ 

i= 1 


Y J {x i + 2) 2 = (-2 + 2) 2 + (1 + 2) 2 + (-4 + 2) 2 + (3 + 2) 2 = 38 


Calcular 


: X(2a,+3)(a,-7) 


i =1 


¿ (2a,. + 3)(JC,. - 7) = (2^ + 3)(a, - 7) + (2x, + 3)(x 2 - 7)... + (2x 4 + 3)(x 4 - 7) 
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g (2x, + 3)(x, - 7) = (2(—2) + 3)((—2) - 7) + (2(1) + 3)((1) - 7)... + (2(3) + 3)((3) - 7) 
4 

X(2* ; +3)(x,.-7) = -2 

i'=l 

De otra forma 


En una tabla establecer varias columnas, la primera para el 
subíndice que toma la variable, la segunda para los valores que 

toma la variable X , la tercera para el primer factor, la cuarta 
para el segundo factor y la quinta para el producto de los dos 
factores, luego para la tercera y cuarta columna se calculan los 
valores numéricos para cada valor de la variable y para la quinta 
el producto de los valores obtenidos en los pasos anteriores, y la 
suma de estos valores es el resultado pedido. 


i 


2x¡ + 3 

x ~ 7 

(2x ; .+ 3)(x - 7) 

1 

-2 

-i 

-9 

9 

2 

1 

5 

-6 

-30 

3 

-4 

-5 

-11 

55 

4 

3 

9 

-4 

-36 





-2 



= 9 - 30 + 55 - 36 = -2 


PROPIEDADES DE LAS SUMATORIAS SIMPLES 

Sea la sumatorla: 

t*. 

i—a 


Siendo a y b números enteros {a < b), y el subíndice "i" que 
toma valores enteros consecutivos desde “a” hasta “b”, donde: el 
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valor de “a” es el límite Inferior y “b” es el límite superior de la 
sumatorla. Teniendo en cuenta la definición de sumatorla, se 
tienen las siguientes propiedades matemáticas: 

I. El número de términos o sumandos de una sumatorla es 
Igual al limite superior menos el limite Inferior más la 
unidad; es decir, 

N°Tér min os = b — a +1 

ii. La sumatorla de un valor constante, es Igual a laconstante 
multiplicada por el número de términos de la sumatorla; es 
decir, sea x¡= m Vi = a, a + 1, a + 2,..., b , entonces: 

b 

m = m(b — a + 1) 

i=a 

Siendo: ni la constante 

iii. La sumatorla de una constante multiplicada por una 
variable, es Igual a la constante por la sumatorla de la 
variable; es decir: 

b b 

X mX i = m Yj X ¡ 

i=a i=a 

Siendo: ni la constante 

¡v. Sea la combinación lineal x '~ ~ ^ , la 

X 

sumatorla de los ' para i = a, a + 1, a + 2,..., b., es 
Igual a: 

b b b b 

X-T = X ( n y¡ 1 P z ¡ ± 9) = n X yi 1 tX Z¡±q(b-a + 1) 

i=a i=a i=a i=a 


Siendo: n,p,q constantes 
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1.7.2. SUMATORIAS DOBLES 

Sea X , una variable en estudio, cuyo valor es el resultado de 
observar simultáneamente dos características a una unidad 

X ij 

elemental, valor que toma doble subíndice , representa el 
valor que toma la variable X en la i-¿sima fila {primera 
variable) y la j = ¿sima columna (segunda variable), por lo 
tanto si se tiene “a” filas y “b” columnas, la suma total de los 
valores de la variable X se puede representar por la doble 
sumatoria; es decir, 

a b 

¡= 1,/=1 

Ejemplo: desarrollar 

2 3 3 3 

Z(2>*)= 2X+2X 

Í=U=1 7= 1 B0 7=1| 

desarrollando I el subíndice "i 


desarrollando I el subíndice " j" 


b d 


PROPIEDADES DE LAS SUMATORIAS DOBLES 


Sea la sumatoria doble: 



x a 


i-a j -c 


Siendo a,b,c,d números enteros positivos, y los subíndices 
“i”, “j” toma valores consecutivos desde “a” hasta “b” y desde “c” 
hasta “d” respectivamente; los valores “a” y “c” son los límites 
inferiores, y “b” y “d” son los límites superiores de la doble 
sumatoria. 

Teniendo en cuenta la definición de sumatoria doble, se tienen 
las siguientes propiedades matemáticas: 

i. El número de términos de una doble sumatoria es Igual al 
producto del número de términos de la primera sumatoria 
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con el número de términos de la segunda sumatorla; es 
decir: 

N ° Tér min os = (b - a + 1 )(d - c + 1) 

¡I. La doble sumatorla de una constante, es Igual a la 

constante multiplicada por el número de términos de la 

X — ^IJ 

sumatorla; es decir, sea 11 ’ , entonces: 

b d 

= m(b — a + 1 )(d - c + 1) 

i=aj=c 

Siendo: m la constante 

iii. La doble sumatorla de una constante multiplicada por una 
variable, es Igual a la constante por la doble sumatorla de 
la variable; es decir: 

b d b d 

i=a j =c i-a j =c 

Siendo: ni la constante 

¡v. Sea la combinación lineal X ' j ^‘j — P^u— Q j | a doble 

x 

sumatoria de los lJ , es igual a: 

b d b d b d b d 

Z Z x u = Z Z («% ± P z u ± 9) = «Z Z y ¡i ± pYj Z Ztjíqib-a + vxd-c + l) 

Siendo: n, p, q constantes 
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1.7.3. NOTACIÓN PUNTUAL PARA UNA SUMATORIA DOBLE 
Sea la tabla de doble entrada (conocida como tabla de contingencia) 


V’/" 

\ 

1 

2 

3 


k 

Total 

1 

*n 

*12 

*13 


*i k 

*1. 

2 

*21 

*22 

*23 


*2 k 

*2. 

3 

*31 

*32 

*33 


*3A: 

*3. 








r 

*,.1 

*7 2 

*r3 


*7* 

*7. 

Total 

*1 

*2 

*3 


*.* 

X 


De la tabla la suma de los elementos de la primera columna 

r r 

*11 + *21 + *31 + ... + *ri = X *n ; al valor de la sumatoria X *¡i se 

i =1 i= 1 

le representa mediante la siguiente notación puntual *i ; es decir, 

r 

X Ti = *i 

/=1 

■* 1 = corresponde a la sumatoria simple de todos los elementos *¿i , 
para "i" que toma valores desde 1 hasta r, de la primera columna. 

De la tabla la suma de todos los elementos de la 1 ra fila 

k 

x n +x n +Xu+ ■■■ + x lk = = * 1 . (Corresponde a la sumatoria 

7=1 

simple de todos los elementos -^í j , para que toma valores desde 
1 hasta k, de la primera fila) 
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También de la tabla 

r k r 


= X 


ZZ *<,= Z*i. 

,=i j =i ¿=i 

1.8. Ejercicios resueltos 

50 


50 


50 


1. Sean ^ x,- = 20 >’ V f = 100 hallar. ^( 3 jc, - 4) 2 

1=1 M i=l 

Solución 

I ( 3 x ,.- 4 ) 2 = S ( 9 x 2 - 2 4 x + 16 ) = ^ 9 x 2 -^ 2 4 x +^ 16 ^ 

i= 1 i 


1=1 ¿=1 


i=l 


50 50 


= 9 ^ xr - 24 ^ T + 16(50 - 1 + 1 ) = 9 ( 100 ) - 2 4 ( 20 ) + 16 ( 50 ) = 1220 


í=l 1=1 


2. Simplificar 


x + 5 x <■ + 5) 2 - Jjx i + 1 )(t + 2 )(x, + 3 )(x, + 4 -) 


Solución 


X(xr + 5 x, + 5) 2 - X(x, + 1 )(-T + 2 )(X; + 3 )(x,. + 4 ) 


;=1 


¡=1 


Tx x+5x. + 5) 2 - g(x. + 1 )(x, + 4)(x, + 2)(x,. + 3) 

n n 

g( X) 2 + 5x i + 5) 2 - yj(x + 5x i + 4 )(T 2 + 5*,. + 6) (1) 

Supongamos que y = x 2 + 5x , luego reemplazando en (1) se tiene 


l l l 
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¿(J,- +5) 2 

Í= 1 

x{+ }=£{}= - + = 

( y¡ 10y, 25) (y¡ 10y, 24) 1 1 (n 1 1) n 

i= 1 ¿=1 

3. Simplificar 

a b 

( X ij -x¡ - x ■ + X ) 

i= 1 ./=! 

Solución 

a b 

EX +xx 

i=lj=l 

a b a b a b a b 

XX x ¡r XX x i - XX X 1 + XX* 

i'=l 7=1 Í=1 7=1 i= 1 7=1 Í=1 7=1 


= x - - a ^ 



+ 4)(y, + 6) = g {(y ; + 5) 2 -(>’■ + 4)(y,. +6)} 


= x - bx— ax+ abx = (1 - a){\ - b)x 

n n 

4. Sean: ^.^=100 y ^ x¡ = 5 , Calcular el valor 

í=i 1^1 

n 2 

X(*,- l0 > 

¡=r 

de 

n 

Desarrollando el numerador de la sumatorla y aplicando las 
propiedades: 
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Z >,- 10 ) = ^(* 2 


20* +100) =I^-20Z- 


+ lOOn 


i= 1 


100-20(5) + 


100/7 

Luego se tiene que:_ 


n 


100 


5. De la tabla 


i 



1 

4 

5 

2 

5 

6 

3 

2 

-4 

4 

3 

5 

5 

2 

7 


Calcular el valor de : ^ 2(7* 2 

i 

1=1 

¿ 2(7* 2 -5/ ) 2 = 2^(7* 

i i i 

i=\ i= 1 


5 y 3 ) 2 

i 

-5 v 3 ) 2 

i 


De la tabla 


i 


y¡ 

7 * 2 

i 

5.y 3 

i 

lx 2 - 5 J 3 

i i 

(7x 2 - 5y 3 ) 2 

/ i 

1 

4 

5 

112 

625 

-513 

263169 

2 

5 

6 

175 

1080 

-905 

819025 

3 

2 

-4 

28 

-320 

348 

121104 

4 

3 

5 

63 

625 

-562 

315844 

5 

2 

7 

28 

1715 

-1687 

2845969 

Suma 






4365111 


2^2(7x 2 - 5 y 3 ) 2 = 2(4'365,111) = 8730,222 

i i 

i= 1 
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1.9. Ejercicios Propuestos: 

De la tabla que se presenta a continuación: 


k 

1 

2 

3 

4 

5 

X k 

2 

1 

0 

3 

1 


Calcular: 

5 


1. 


y (5 +3*,) 


k =1 


2 


2 . 

3 


Y(*f-* t + b 2 

t=1 


ZÍ** -x) 2 -(x + x ) 2 \ 

k= 1 


donde “ _ ¿=i 
5 


4. 

5. 

6 . 


V {(5a, -4X5^ +4)} 

í 5 l 2 

t2>*-n 3 1 
U=i J 

5 5 

-5)Z(** +5 ^ 


7. De la información dada en la tabla, si a cada valor se le 
Incrementa en un 40% más 3 unidades. Hallar la suma de los 
cuadrados de los nuevos valores. 

Dada las siguientes expresiones simplificar: 
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8 . 


10 . 


13. 


~ x ) 


siendo x: 


n 

5 - 


Í= 1 


n 


X x - 


Yj( x í -x)x¡ - J (x ; -*) 2 

n 

-x)(y¡-y) + 


siendo v _ é¡ 
n 


i= i 


Donde: x : 


I*. 




i=l 


n 




Í=1 


/t 


11. Sea y¡ — CIX¡ i C para i — 1,2,..., 72, 

n 

calcular el valor de y¡ - y) 2 


i= 1 


72. Sea X( x * _3 ) 2 = 18 donde ^ X i ^ 

i= 1 i =1 

+ 3 ) 2 


Calcular el valor de 


i =\ 


Sea I> f +5) 2 =200, 

1=1 


calcular el valor de 


z 




(*, ~xY 


donde A — ^ — 1 


Sean X e Y dos variables que toman valores tal como se presenta en la 
tabla. 
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i 

i 

2 

3 

4 

5 

Xi 

1.65 

1.70 

1.75 

1.80 

1.85 

y¡ 

60 

65 

70 

75 

80 


Calcular: 

14.X(2 x i + y) : 


15 -Yj{ 2 ( Xí + x)(y¡ - y)- 11},siendo 

i= 1 

i y, 


y 


i=l 


16. 


£(*,- - x )(y, - y ) 


siendo 


X i*.--*)*.- 


17. 


y -jy+Vi 


¿=i 

5 


— 2 


- 2 


2>, 


X = 


i=l 


¿y _ 


1- = ^ 


Z x <' X>'. 


18 


siendo x = . ¿=i 


I 1 ''- '' 1 -?><• •».-=-5-^-r 

5 

: ^(x,.-M) 2 =10 |Siendo: 


19. Calcular el valor de “M” en : 


i=l 


2a =15 y 2 A 2 =55 

i = 1 (=1 
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X 

Dada la siguiente tabla de doble entrada con valores ^ij 


1 

1 

2 

3 

4 

1 

2 

1 

0 

0 

2 

4 

1 

2 

3 

3 

0 

2 

0 

1 


Calcular las siguientes sumatorlas: 

20 . 

í= i j =i 

±<xl + £xl+x 2 ) 

l. .j 

21. 7 1 

¿O./ + 2) 2 

22 . ' =1 

ÍÉ*,)' 

23. ¿=1 ^ =1 

¿¿(x 2 + x 2 — x 2 + 24x ) 

i i .i 

24. 1=1 J =l 

n 

2>,+ 2 ) = 5n 

25. Sea la siguiente ecuación Í=1 , Hallar en valor 

de: 



n 

26. Hallar la suma de los coeficientes al desarrollar: 

5 

X ( 3 ^ +5 ^) 12 

i= i 
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27. Simplificar 

n+\ n n 

y 2 ¿ - i +y 2 ¿ -2Y 2 n - 1 

4-v A-* 4-0 

En un asiento minero de Cerro de Pasco, para un mes determinado, la 
administración hace la distribución del personal de ingenieros por turno 
y modalidad de trabajo, tal como se presenta en la tabla: 


N\/lodalidades 

Tajo 

Abierto =1 

Socavón = 2 

Seguridad = 3 

Turnos 





Turno =1 

16 

20 

2 

Turno =2 

30 

40 

2 

Turno =3 

0 

70 

4 


Donde X ij = corresponde al número de ingenieros para el i-ésima turno 

en la j-éslma modalidad de trabajo. Para cada caso expresar por 

sumatoria y calcular su valor: 

28. Total de ingenieros que laboran en el 1er. Y 3er turno, para 
todas las modalidades. 

29. Total de ingenieros que laboran en el 1er. Y 3er. Turno, para las 
modalidades de trabajo: tajo abierto y seguridad. 

30. Si los ingenieros del 1er. Turno ganan “b-a” nuevos soles, para 
los del 2do. Turno “b” nuevos soles y para los del tercero “b+a” 
nuevos soles. Cual es el total a pagar por la administración en 
ese mes. 

31. Simplificar 

2 ]( y 2 + I3x + 41) 2 - ^(x + 5)(x + 6)(x + l){x + 8 ) 

i i i i i i 

i= 1 1=1 

32. Simplificar 

+y -^-y) 2 -^¿(x 2 +y 2 -¿oc -yy ) 

i j ‘ Í i í 

1=1 7=1 ¿=1 7=1 
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2 >, I>, 

Donde : x - ¿$=i y y = — - 

a J b 

33. Simplificar 

X'U 4 + 5x 2 + 5) 2 - £(x 2 + l)(x 2 + 2)(x 2 + 3)(x 2 + 4) 

i i i i i i 

i= 1 /=1 

34. Simplificar 

n +1 _ n+1 _ 

X U, - *)*,- - X - *) 2 

i =1 i =1 


35. Simplificar 


n n 

Y J (x i + a) 2 - ¿ - ^ 

¿=i ¿=i 

36. Simplificar 

2 3 

EE (5-E-. + 5x • - 2x l - 2x 2 ) 

' =1 7=1 

37. Simplificar 

a b a b b 

XZK 2 -ZX* v +«Z(*7 -*») 2 

* —i 7=1 í =17=1 j= 1 

38. Simplificar 

a+l ¿>+1 a b 

EE- v > EE- v - 

f=l 7=1 i=l 7=1 
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39. Simplificar 

ZZ<></ -xjx.i -ZZU; 

¿= 1 7=1 1=1 7=1 

JC JC JC 

40. Sea 1 ’ 2 ’"" 100 , una muestra de 100 datos, cuya suma de 

sus valores es igual a 400. Si a cada dato se le incrementa en 
5% de su valor más la unidad, calcular la nueva suma. 

41. Simplificar 




( X -J^)x 






y •• y ^ u —i v , 

í=i 7=1 i=i 7=1 ÜO i=ij=i 


42. Simplificar 

a b 

YYi.ví, — .v .,• 1 v 


1=1 7 =1 


43. Simplificar 


1 


44. 


h — X ) + , 0 

yy( x - _y(yX) 

¡j L j A ij 

1 = 17=1 b U 7 = 1 

Simplificar 

11 12 12 

2A + !)*; ~ ZA + 4 )( x ¿ - 3) + + 12 X x ; - 1 !) 


12 


45. Simplificar 


a b 


XX^A - Xi.)(Xi. - x..) 

1 = 1 7=1 
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¿U- -xf 


46. Sea i=1 donde n 

n 

Calcular el valor de : V w x . 

i i 

;=i 

La Empresa de transporte San Francisco S.A, cuenta con 4 
vehículos cuya ruta comprende los distritos del Callao con la Molina. 
Se define a la variable en estudio Xlj= Numero de boletos 
entregados a los usuarios en el 1-éslmo vehículo para el j-éslmo 
turno, tal como se presenta en el siguiente cuadro: 


^\Vehículos 

Vehículo=1 

Vehículo=2 

Vehículo=3 

Vehículo=4 

Turnos 





Turno=1 

400 

500 

600 

600 

Turno=2 

300 

400 

400 

300 

Turno=3 

400 

400 

400 

400 


Expresar mediante sumatorlas y calcular su valor 

46. El Total de boletos expedidos a los usuarios del 1er y 3er turno 
para todos los vehículos de la empresa. 

47. SI el precio para el tercer turno es el doble del precio del 2do y el 
precio del primer turno es la mitad del 2do turno, siendo el precio 
del 2do turno Igual a “q” nuevos soles. 

48. El total de boletos expedidos por los tres turnos para el 1 ro y 4to 
vehículo. 


49. 


Simplificar 

n n 


XXC*; -x)(y j -y)z i 


nz 


Zc*; -*>yj 


siendo: 


¡=i 7=1 
n 



X - 


i= 1 

n 


7=1 

n 



n 
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50. Dada la siguiente tabla con valores 11 = Valor que toma la 
variable X en la i-éslma fila y j-éslma columna. 


Calcular: 

a. 


b. 


c. 


N \ j 

i \ 

1 

2 

3 

1 

2 

1 

2 

2 

3 

2 

0 

3 

2 

2 

3 

4 

4 

1 

2 


-x..) 2 

i= 1 


3 



-X.jf 


i = 17=1 


51. Expresar mediante sumatorlas las siguientes sucesiones de 
términos: 


a. 

1,2,3 

X lJ +X 2 j+X 3 j 

+•••+4 

b 

■*1,2 X 2,3 "*■ *3,4 

+-+4w 


-T. -T-, X, 

X k 


*+ 2 + 3 +... 

, + ¿ 

c. 

■'fr 

K 

en 

K 

es 

K 

*¿+1 


d. + y 2 ) 1 + (x, + y 3 ) 4 + (x 3 + y 4 ) 9 +••■(** + y* + if 2 
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52. Sea la tabla de datos: 


i 

*i 


1 

5 

1 

2 

4 

2 

3 

3 

3 

4 

2 

4 

5 

1 

5 


Calcular: £(*? + 2x i y¡ + y] ) 2 


53. Sea la tabla de datos: 


i 



Zi 

1 

2 

3 

3 

2 

1 

2 

2 

3 

1 

3 

4 

4 

2 

2 

1 

5 

1 

2 

2 


Calcular: 


\ ^ 

+ Zj)(y/ + z¡) 

a) i=1 

5 

2>,+2)0>,+3)(z,-5) 

b) í=i 

5 

X(4 x ¡ + 3 >', -5 zMy +2y,- -3z f ) 

c) 

¿ [*/ + 2 y,.) + + 2 z¡ ) + Z¡ (z, + 2x,j] 

d) w 


54. 


Sean las sumatorias: 

20 

= 274 


Hallar: 


20 

£jc¡ 2 = 3834 

i=l 
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20 

a) . ^[5(x, - 2) 2 -2(3x,. - 1) 2 J 

l=l 

20 

b ) - Y i x i ( 7x ; + 2) - 3x í ( 4x í + o] 

i=l 

20 

c) . X 12 [( 2 ^ + 4)(3 -t,.-5)] 

i=l 

20 

d ) . ^ 10(3x, + 5) 2 

i=i 

20 

e) . X(2x I .+5)(2x ¿ -5) 

i=l 

Explorando el SPSS 

Al activar el SPSS mostrara una ventana con las opciones de vista de 
variables y vista de datos, que se puede seleccionar en la parte Inferior 
Izquierda: 



Antes de empezar a Ingresar los datos, lo que se tiene que hacer es 
definir las variables; la vista de variables presenta las siguientes 
opciones: 
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Nombre: Nombre abreviado de la variable, no acepta caracteres $, #; 
no permite dejar espacios en blanco. 

Tipo: Para indicar el formato de la variable: numérico, cadena. 

Anchura: Para determinar la cantidad de caracteres que tendrá un 
dato. 

Decimales: Para datos de tipo numérico o moneda. 

Etiqueta: Nombre completo de la variable. 

Valores: Para el caso de variables cualitativas se puede definir a que 
categoría corresponde cada valor. 

Perdidos: Indica que valores son codificados como datos perdidos o 
excluidos del análisis. 

Columna: Define como será la alineación de la columna y se 
visualizará en la ventana de ingreso de datos. 

Alineación: Define como será la alineación de los datos en la ventana 
de ingreso de datos. 

Medida: El SPSS distingue tres tipos: escala, nominal y ordinal. 

@ vimed16.sav(ConjuntoDatos1]-IBM SPSS Statistics Editor de datos — 3 X 

Archivo Editar Ver Datos Transformar Analizar Gráficos Utilidades Ampliaciones ventana Ayuda 

¥I¥T^liiFTgf^i 
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CAPÍTULO 2 

ORGANIZACIÓN DE DATOS 


INTRODUCCIÓN 

Tiene por objetivo presentar los datos cualitativos o cuantitativos de 
una muestra, para una o más variables de interés, en tablas de 
distribución de frecuencias y sus correspondientes gráficos. Con la 
finalidad de resumir los datos de la muestra, para un mejor análisis e 
interpretación. 

2.1. ORGANIZACIÓN DE DATOS 

Los datos recopilados de una población, lo cual conforma la muestra al 
azar, para el estudio de una variable de interés, conducen muchas 
veces a una gran cantidad de números o atributos, los cuales al intentar 
analizarlos en su forma original presentan dificultad en cuanto a su 
análisis e interpretación. Existe muchas interrogantes sobre la 
naturaleza de los datos, tales como: 

a. Que dato o grupos de datos se presenta con la mayor o menor 
frecuencia. 

b. Cual es la distribución empírica de estos datos con respecto a la 
población (simétrica o asimétrica). 

c. La presencia o no de datos discordante (atípicos). 

d. Ubicar las medidas de tendencia central, que representan al 
conjunto de datos. 

Estas interrogantes se resuelven si los datos son organizados y 
presentados en tablas de distribución de frecuencias (univariadas, 
bivariadas, etc.). 

Una tabla de distribución de frecuencias es un arreglo rectangular en 
filas y columnas en la cual los datos de una muestra o población son 
resumidos. En la primera fila de la tabla se colocan: el nombre de la 
variable en estudio, la frecuencia absoluta, la frecuencia relativa, la 
frecuencia absoluta acumulada, la frecuencia relativa acumulada y la 
marca de clases, esta última solo para variables cuantitativas 
continuas. 
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Titulo: 


Variable 

en 

estudio 

Frecuencia 

absoluta 

Frecuencia 

relativa 

Frecuencia 

absoluta 

acumulada 

Frecuencia 

relativa 

acumulada 

Marca 

de 

clase 

Clase-1 






Clase-2 


















Clase-k 






Total 







Leyenda: 

Fuente: 


2.2. ELEMENTOS DE UNA TABLA DE DISTRIBUCIÓN DE 
FRECUENCIAS 

• TÍTULO 


Se coloca en la parte superior central de la tabla, el título debe 
ser claro y conciso y guarda relación con la variable que se 
estudia y debe Indicar el tamaño de la muestra. 

• FUENTE 


Se coloca en la parte Inferior de la tabla y corresponde al nombre 
de la entidad (pública o privada) o literatura de donde se obtuvo 
la Información, debe Incluir la fecha si es posible. Si el mismo 
Investigador es autor de dicha Información, debe colocar fuente 
propia. 

• LEYENDA 


Se coloca delante de la fuente y corresponde a una nota o 
aclaración con respecto al contenido de la tabla. La leyenda se 
coloca solo cuando es necesario. 

• CLASES 


Los datos (valores que toma la variable) de la muestra se 
clasifican en clases. Las clases son cualidades, números o 
Intervalos; si la variable es género, las clases son: varones o 
mujeres, si la variable es número de hijos por familia las clases 
son: familias que no tienen hijo 0 hijos, 1 hijo, 2 hijos, etc. Si la 
variable es edad de estudiantes universitarios las clases podrían 
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ser 18 hasta 22, 22 hasta 26,..,etc. Las clases para una tabla de 
distribución de frecuencias deben ser mutuamente excluyentes; 
es decir, un dato de la muestra solo pude pertenecer a una 
determinada clase. Al número de clases de una tabla se le 
representa por la letra "k". 

SI existe una gran cantidad de datos discretos o continuos, el 
número de clases debe encontrase entre 5 y 15. Un número 
pequeño de clases puede ocultar la distribución real del conjunto 
de datos, mientras que un número muy grande puede dejar sin 
observaciones algunas de las clases, limitando de esta forma su 
uso. 


FRECUENCIA ABSOLUTA 


Su valor Indica el número de veces que los datos de la muestra 
caen o pertenecen a una determinada clase. Se representa por 

f 

Jl . Para una muestra de tamaño "n" y con "k” clases se 
cumple que la sumatoña de todas las frecuencias absolutas es 
Igual a "n"; es decir, 


k 



= n 


Siendo 

f 

J ' = valor que toma la frecuencia absoluta en la i-eslma clase 
n = tamaño de la muestra 
k = números de clases 


FRECUENCIA RELATIVA 


Su valor Indica la proporción o porcentaje de la muestra está 
contenida en una determinada clase (parte de la muestra que 
pertenece a una determinada clase). Se representa por h¡ y se 
obtiene al dividir la frecuencia absoluta por el tamaño de la 
muestra; es decir, 



n 


(En proporción) 
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f. 

= '*100% (En porcentaje) 
n 

En ambos casos se cumple que: 

k 

Nota: ^ h¡= 1 o 100% 

í=i 

FRECUENCIA ABSOLUTA ACUMULADA 


Para una variable discreta, un valor de frecuencia absoluta 
acumulada Indica, cuantos datos de la muestra son menores o 
¡guales al valor de la clase correspondiente; para una variable 
continua, Indica cuantos datos de la muestra, tienen valores 
menores al límite superior para esa clase. Se obtiene al 
acumular los valores de las frecuencias absolutas. Se representa 
por F¡ , y se obtiene por: 

i 

F.= Z fj ‘= 1A -’ k 

j= 1 

k 

Nota: F k =Y J f j = n 

j =i 

F,= I+F„ F_, = 0 

• FRECUENCIA RELATIVA ACUMULADA 


Para el caso discreto, un valor de frecuencia relativa acumulada, 
Indica la proporción o porcentaje de datos de la muestra que 
tienen valores menores o ¡guales al valor de esa clase; para el 
caso continuo, Indica la proporción a porcentaje de datos de la 
muestra que tienen valores menores al límite superior para esa 
clase. Se obtiene al acumular los valores de las frecuencias 
relativas para cada clase. Se representa por H i . 

i 

H [ =Yj h j i=l ¿T~’ k 
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También se obtiene dividiendo cada valor de la frecuencia 
absoluta acumulada por el tamaño de la muestra; es decir; 

h - F ' 

H ¡~— i =1,2 . k 

n 

Nota: H k = 1 o 100% 

H, = h, + H¡ , H ¡ = 0 

• MARCA DE CLASE 


El concepto de marca de clase, solo se usa cuando se elabora 
una tabla de distribución de frecuencias para una variable 
cuantitativa continua, y su interpretación matemática de su valor, 
corresponde al punto medio para una determinada clase. 
Estadísticamente, es un valor representativo para todos los 
datos que pertenecen a una determinada clase, se representa 

por x ¡ Se calcula usando la fórmula: 

. Limite inf erior de la i — esima clase + Limite sup erior de la i - esima clase 


x t = 


LI ,+ LS, 


Nota: 


En una tabla de distribución de frecuencias con ancho de clase 
fijo, se cumple que: La segunda, tercera,...k-ésima marca de 
clase, es igual a la marca de clase anterior más el ancho de 
clase, es decir: 

X i+l = X i +A i — 2,.., k —1 

Donde A = ancho del Intervalo de clase (ancho de clase) 
Demostración 



LI i +LS ¡ 
2 


( 1 ) 
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X M = 

li m + ls ¡+ 1 

(2) 

2 

como 

ll m =ls ¡ 

LS i+ 1 = 

x M = 

LS¡ + LS¡ + A 

2 

- (3) 


(3) - (1) 

-x' _ LS i+ LS, + A L I , + LS¡ 

Í+1 ¿ 2 2 
LS¡ — LI ¡ +A 

X M -X = —-—- como LS¡ -U = A 

X i+l - X \■ = ——— = A X ' ¡+1 = X \ + A 

Nota: 


fi=F-F H 
h,= H, - H i X 

2.3. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PARA UNA 

VARIABLE CUALITATIVA 

Cuando los datos corresponden a una variable cualitativa 
(Nominal o Jerárquica) la tabla de distribución de frecuencias 
tiene la siguiente forma: 


Título: Corresponde a la variable en estudio 


i 

Variable 


h t 

1 

c, 

fi 

K 

2 

C 2 

Í2 

h 2 





k 

Q 

f k 

K 


Total 

n 

1 


Fuente: Entidad que proporciona los datos 
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Los valores C¡ corresponden a valores que toma la variable (clase), 

si la variable es nominal no existe un orden entre sus valores, en 
cambio si la variable en estudio es ordinal o jerárquica debe tomarse en 
cuenta el orden de sus valores, ya sea en forma ascendente o 
descendente. 

Para esta variable se presentan algunos tipos de gráficos, pero los más 
frecuentes es el GRÁFICO de barras verticales u horizontales, 
GRÁFICO circular, GRÁFICO de líneas y gráficos pictóricos. 

Ejemplo 

Con la finalidad de estudiar la variable X = Preferencia a determinados 
marcas de jabones de tocador por las alumnas de la UNMSM, se toma 
una muestra aleatoria conformada por 30, los resultados son: 


Rexona 

Palmollve 

Rexona 

Camay 

Palmollve 

Lux 

Camay 

Lux 

Lux 

Rexona 

Camay 

Lux 

Camay 

Rrexona 

Camay 

Lux 

Lux 

Camay 

Lux 

Camay 

Rexona 

Rexona 

Camay 

Lux 

Lux 

Camay 

Palmollve 

Lux 

Lux 

Lux 


Fuente : PACOCHA S . A. 

Para este ejemplo la tabla de distribución de frecuencias es: 

Preferencias a marcas de ¡abones de tocador por alumnas de la 

UNMSM (n=30). 


i 

Marca de jabones 
de tocador 

f¡ 

h¡ 

Á,*100% 

1 

Rexona 

6 

0.2 

20% 

2 

Camay 

9 

0.3 

30% 

3 

Lux 

12 

0.4 

40% 

4 

Palmollve 

3 

0.1 

10% 


Total 

30 

1.0 

100% 


Fuente: PACOCHA S.A 


Calcular e Interpretar: 

f 2 = 9 alumnas encuestadas prefieren el jabón de tocador de marca 
camay 

h 2 = 30% de las alumnas encuestadas prefieren el jabón de tocador de 
marca} Camay. 
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GRÁFICA DE BARRA 

Preferencias a marcas de jabones de tocador 
Por alumnas de la UNMSM 



Rexona Camay Lux Palmolive 


Fuente: PACOCHA S.A 
GRÁFICA CIRCULAR 



11 Rexona ¡a Camay ■ Lux 0 Palmolive 
Fuente: PacochaS.A 

Aplicando el SPSS en el Cálculo de las frecuencias, y gráficos. 
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a. Definiendo las variables 


tjé *St(» Mulo; |ConjuMoOaUn2J - IBM SPSS SMUstiu Ediloi da daloi — O 



b. Ingresando los datos 


Q FRECUlNClAisav |ConjunIoDj«oi2) - IBM SPSS Sututics Edito. Ot dalos - O 

Archivo Editar *et Dalos Iransformar Analizar Gráneos imanadas Ampliaciones Ventana Anida 

mu & H «fes» n m -3 
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c. Calculando las frecuencias: En el menú del SPSS, escoger la 
opción ANALIZAR-ESTADISTICOS DESCRIPTIVOS- 
FRECUENCIAS-pasar la variable Marcajabon al casillero de la 
derecha-y ACEPTAR 


ti 'Sin titi*>2 IConiuntoDstosJ] - IBM SPSS Statisbcs Editor de datos 

Archivo Editar Ver Datos Iransformar Anafear Gráficos Utilidades Ampkaoones ventana 


glN^ TO stüll gg 3^ : H 


|<a Marea Jabón --ar 


tá 



Rexona 

Lux 

Palmoirre 


P 3 ™/ I 


7-- 

Vista de datos vista de vanaflles 


£ Stakstcs Processor está listo UnicodeON 


I P Escribe aquí para buscar 


Él@ 


fifi 


d. 


Resultados: 


Marca de jabón 


Frecuencia Porcentaje 

Porcentaje 

válido 

Porcentaje 

acumulado 

Válido Camay 

9 

30,0 

30,0 

30,0 

Lux 

12 

40,0 

40,0 

70,0 

Palmollve 

3 

10,0 

10,0 

80,0 

Rexona 

6 

20,0 

20,0 

100,0 

Total 

30 

100,0 

100,0 
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e. Gráficos barra: En el menú escoger la opción GRÁFICOS- 
CUADROS DE DI ALOGO ANTIGUOS-BARORAS-SIMPLES- 
DEFINIR-pasar la Variable Marca de jabón a la casilla eje de 
categoría-ACEPTAR 



Marca de jabón 


f. Gráficos Circular: Gráficos barra: En el menú escoger la opción 
GRÁFICOS-CUADROS DE DIALOGOANTIGUOS-CIRCULAR- 
RESUMENES PARA GRUPO DE CASOS-DEFINIR-pasar la 
Variable Marca de jabón a la Definir porcionespor-ACEPTAR 
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2.4. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PARA UNA 

VARIABLE CUANTITATIVA DISCRETA. 


Cuando los datos corresponden a una variable cuantitativa discreta la 
tabla de distribución de frecuencias tiene la siguiente forma: 


Título: corresponde a la variable en estudio 


i 

Variable 

fi 

h, 

Fi 

H, 

1 

Q 

fi 

K 

Fx 

Hy 

2 

c 2 

Í2 

h 2 

F2 

H 2 







k 

C k 

f k 

K 

F k 

H k 


Total 

n 

1 




Fuente: entidad que proporciona los datos 
Los valores C¿ corresponden a valores que toma la variable (clase) 
Ejemplo 

Los siguientes datos corresponden a una muestra aleatoria de 50 
tiendas que se dedican a la venta de gas, con la finalidad de analizar la 
variable Y = número de balones de gas vendidos en un día 
determinados, los resultados son: 


21 

23 

24 

23 

24 

21 

24 

23 

24 

22 

22 

24 

21 

22 

24 

22 

24 

25 

26 

25 

24 

23 

23 

21 

23 

23 

22 

24 

26 

26 

22 

23 

22 

24 

21 

25 

22 

25 

23 

24 

25 

26 

24 

22 

25 

24 

25 

21 

26 

23 


Elaborar la Tabla de distribución de frecuencias y sus gráficos 
respectivos 
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Número de balones de gas vendidos (n=50 tiendas) 


i 

Variable 

/■ 

K 

Ft 

H, 

1 

21 

6 

12 

6 

12 

2 

22 

9 

18 

15 

30 

3 

23 

10 

20 

25 

50 

4 

24 

13 

26 

38 

76 

5 

25 

7 

14 

45 

90 

6 

26 

5 

10 

50 

100 


TOTAL 

50 

100 




Fuente: SOL GAS S.A 


Hallar e interprete: 

/ 3 = 10(significa que 10 tiendas, tienen una venta de 23 balones de 
gas) 

h 2 = 20%( significa que el 20% de las tiendas, tienen una venta de 23 
balones de gas) 

F 4 =38(sign¡fica que 38 tiendas, tienen una venta entre 21 y 24 
balones de gas o menor o igual a 24 balones de gas) 

F 5 - F 2 =45-15=30(significa que 30 tiendas, tienen una venta entre 23 

y 25 balones de gas) 

Gráfica de bastones 

NUMERO DE BALONES DE GAS VENDIDO EN 
UN DIA DETERMINADO 



FUENTE:SOL GAS 
S.A. 

Aplicando el SPSS en el cálculo de las frecuencias, y gráficos. 
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Definiendo las variables 


ti 'Sin titulo3 ICoryuntoDetoií] - IBM SPSS Sutntia Editor de detos 

Arenero E«ar Ver Qatos Translormer Anadiar Críneos ywidades Amplieoones Ventana Ajyda 



Ingresando los datos 


EO «''■ H 


l 4»H 


visioi* 1 oe 1 vaneóles 
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Calculando las frecuencias: En el menú del SPSS, escoger la opción 
ANALIZAR-ESTADISTICOS DESCRIPTIVOS-FRECUENCIAS-pasar la 
variable días de venta gas al casillero de la derecha-y ACEPTAR 

Q ’in tituloS [Con,untcD«o.3] - IBM SPSS SteteMi Editor d> dote» O X 

«crino £<M» Yer Datos Iranstotmai Analuac Grtícoo mMades Ampliaciones ventana \>uaa 



A 3 Escribe aquí para buscar 


o » e m a « w • s f* «-■ 


Resultados: 


1 

Frecuencl 

a 

Dia venta gas 

Porcentaj Porcentaje 

e válido 

Porcentaje 

acumulado 

Válido 21 

6 

12,0 

12,0 

12,0 

22 

9 

18,0 

18,0 

30,0 

23 

10 

20,0 

20,0 

50,0 

24 

13 

26,0 

26,0 

76,0 

25 

7 

14,0 

14,0 

90,0 

26 

5 

10,0 

10,0 

100,0 

Total 

50 

100,0 

100,0 
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Gráficos barra: En el menú escoger la opción GRÁFICOS-CUADROS 
DE DIALOGO ANTIGUOS-BARAS-SIMPLES-DEFINIR-pasar la 
Variable Día venta gas a la casilla eje de categoría-ACEPTAR 



2.5. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PARA UNA 

VARIABLE CUANTITATIVA CONTINUA 


Cuando los datos corresponden a una variable cuantitativa continua la 
tabla de distribución de frecuencias tiene la siguiente forma: 


Título: corresponde a la variable en estudio 


i 

variable 

/, 

>h 

F, 

n, 

X 

l 

1 

c, 

A 

>h 

Fi 

Hy 

K 

2 

c 2 

Í2 

h 2 

f 2 

H 2 

x 2 








K 

Q 

fk 

K 

n 

1 

x k 


Total 

n 

i 





Fuente: entidad que proporciona los datos 
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Los valores C¿ corresponden a valores que toma la variable (clases) 

Elaborar la Tabla de distribución de frecuencia y sus gráficos 
respectivos 

PROCEDIMIENTO PARA ELABORAR UNA TABLA DE 

DISTRIBUCION FRECUENCIAS PARA UNA VARIABLE 

CUANTITATIVA CONTINUA 

Cuando los datos pertenecen a una variable cuantitativa continua, las 

clases corresponden a Intervalos de la forma \fl ■> b) , llamados 
Intervalos de clases, siendo “a” y “b” el límite inferior y superior 
respectivamente del Intervalo de clase. 

METODOLOGÍA 

1. Determinación de Rango R 

R =dato mayor - dato menor 

2. Determinación de número de clases K 

Á' = l + 3.31og(?z) n— tamaño de la muestra 

Como el valor de k debe ser un numero entero, usar el 
redondeo simple 

3. Determinación de ancho del Intervalo de clase ( A) 

R I Usar redondeosimple, con el mismo 
A== J 

K r númerode decimalesde losdatos 

El redondeosimple casi siemprese comete error(E) 

Íí)0 —» El dato de Arranque para la tabla = dato menor 

E 

E = (A)k — /fy'i) > 0 —> El dato de arranque para la tabla = dato menor — _ 

[iii) < 0 —> El númerode clases se incrementaen 1 y se sigue(i ó ii) 

El dato de arranque para la tabla es el primer limite Inferior del Intervalo 
de clase. 
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Ejemplo 

Una muestra aleatoria de tamaño n = 34, es tomada con la finalidad de 
estudiar la variable W = peso del recién nacido en la Maternidad de 
Lima. Los resultados en Kg. se presentan a continuación: 

1.5 1.6 1.9 2.0 2.1 2.1 2.3 2.4 2.5 2.5 2.6 2.6 2.7 2.8 2.9 3.0 3.1 
3.1 3.2 3.2 3.2 3.2 3.3 3.3 3.3 3.4 3.4 3.5 3.6 3.6 3.7 3.7 3.9 4.1 

Fuente: Maternidad de Lima. 

Metodología 

1. Cálculo del Rango” R “. 

R = peso mayor -peso menor. 

R = 4.1-1.5 = 2.6 

2. Cálculo del número de clases (K). 

K= 1 + 3.3Log(34) = 6.05388 

Como el valor que toma K debe ser un número entero, usar el 
redondeo simple (redondeo por defecto), se tiene que K = 6. 

OBSERVACIÓN 

El redondeo simple significa, que si un número tiene como 
primer decimal un número mayor o Igual a 5, entonces la cifra 
entera del número se Incrementa en una unidad. 

Ejemplo: 

SI, K = 6.7, usando el redondeo simple K = 7; 

SI, K = 6.4, usando el redondeo simple K = 6; 


a. Cálculo del ancho del intervalo de clase (A) 

El ancho del Intervalo de clase se obtiene a través de la siguiente 
fórmula: 



K 
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Para los datos se tiene: 


A = R _ = 2 ^_= 0.43333 
K 6 

El valor que toma “A”, debe tener el mismo número de decimales 
de los datos originales. Por redondeo simple se tiene: 

A =0.4 


E = AK - R = 0.4(6) - 2.6 = -0.2 


Como el error es negativo, se debe incrementar en una clase 
más(k=7) 

A=2^= 0.4 
7 

E = AK- R = 0 . 4 ( 7 ) - 2.6 = 0.2 

Cuando el error es positivo, la tabla tendrá 7 clases y ancho 0.4 


valor de arranque= dato menor - _= 1.5 

2 


0.2 


= 1.4 


Para determinar los Intervalos de clases es como sigue: 

• El valor de 1.4 es el límite Inferior de la primera clase, el 
límite superior de esa clase se obtiene sumándole a 1.4 el 
ancho de clase 0.4, lo cual da como resultado 1.8. 


• El límite inferior del segundo Intervalo de clase, 
corresponde al límite superior del primer Intervalo de clase 
(1.8) y para obtener su límite superior, al límite Inferior de 
ésta clase se le añade del ancho de clase; y así 
sucesivamente hasta completar las 7 clases. 

• Se utiliza un ancho de clase fijo, permite realizar 
comparaciones de una clase con otra (cuantos elementos 
de la muestra pertenecen a una determinada clase). 

Luego la tabla de distribución de frecuencias para los pesos de 
los recién nacidos es: 
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Pesos (kg.) de recién nacidos registrados en la maternidad de Lima 

(n=34) 


i 

P6SOS (kg) 

f, 

k i 

F, 

H, 

1 

X 

l 

1 


1 1 

1 

OO 

2 

5.88% 

2 

5.88% 

1.60 

2 


'IX-2.2) 

4 

11.76% 

6 

17.64% 

2.0 

3 


2.2 - 2 . 6 ) 

4 

11.76% 

10 

29.40% 

2.4 

4 


2.6 - 3 . 0 ) 

5 

14.71% 

15 

44.11% 

2.8 

5 


3 . 0 - 3 . 4 ) 

10 

29.42% 

25 

73.53% 

3.2 

6 


" 3 . 4 - 3 . 8 ) 

7 

20.59% 

32 

94.12% 

3.6 

7 


' 3 . 8 - 4 . 2 ) 

2 

5.88% 

34 

100% 

4.0 

TOTAL 

34 

100.0% 





1. Hallar e interpretar los siguientes valores: 

f,h,F,H,H-H,X. 

3 3 3 3 5 2 2 

f$ = 4 (Significa que hay 4 recién nacidos que tienen un peso mayor o 
igual a 2.2 Kg, pero menor a 2,6 Kg.) 

h 3 = 11,76%( Significa que el 11.76% de los recién nacidos tienen un 
peso mayor o igual a 2.2 Kg, pero menor a 2,6 Kg.) 

F 3 = 10 (Significa que hay 10 recién nacidos que tienen un peso mayor 
o igual a 1.4 Kg, pero menor a 2.6 Kg.) 

H 3 = 29.40% (Significa que el 29.40% de los recién nacidos tienen un 
peso mayor o igual a 1.4 Kg, pero menor a 2.6 Kg.) 

H 5 -H 2 = 55.89% (significa que el 55.89% de los recién nacidos tienen 
un peso mayor o igual a 2.2 Kg, pero menor a 3.4 Kg.) 

X 2 = 2.0 kg (significa que 2.0 Kg., es el peso representativo para los 
recién nacidos que tienen un peso mayor o igual a 1.8 Kg., pero menor 
a 2.2 Kg.) o es un peso representativo para la 2da clase. 
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2 . ¿Cuántos recién nacidos aproximadamente tienen un peso 
menor a 2.8 Kg. 

Por interpolación lineal 

2.8 Kg, se encuentra en la cuarta clase; 10 recién nacidos tienen un 
peso menor a 2.6 kg; 15 recién nacidos tienen un peso menor a 3 kg y 
“x” recién nacidos tienen un peso menor a 2.8 kg. (utilizando la 2da y 
5ta columna) 


limsup. F¡ 

2.6 10 3 . 0 - 2.6 

2.8 x 3.0-2.8 

3.0 15 


15 -10 
15 -x 


—^ x — 12.5 


13 


Aproximadamente 13 recién nacidos tienen un peso menor a 2.8 kg. 

3. ¿Qué porcentaje de los recién nacidos tienen un peso inferiora 

2.8 kg. 

Como 12.5 recién nacidos tienen un peso inferior a 2.8 Kg, 
entonces 

—>• x = 12 5 12 5 *100% = 36.76% 

34 


4. ¿Qué porcentaje de los recién nacidos tienen un peso superior a 

2.8 kg. 

Como 12.5 recién nacidos tienen un peso menor a 2.8 kg, 
entonces y =34-12.5=21.5 recién nacidos tienen 
pesos superiores a 2.8 kg, luego: 

—x v = 21 5 -> 21 ' 5 *100% = 63.24% 

34 


5. ¿Qué porcentaje de los recién nacidos tienen pesos entre 2.0 kg 
y 3.6 kg. 


0 0 0 0 0 V 0 0000 

2.0 kg 3.6 kg 

Buscamos cuantos tienen un peso menor a 3.6 kg y cuantos tienen un 
peso menor a 2.0 kg, la diferencia de ambas cantidades, nos da 
cuantos recién nacidos tienen pesos entre 2.0kg y 3.6 kg. 
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Un peso menor a 3.6 kq 

limsup. F¡ 


3.4 

3.6 

3.8 


25 ^ 3.8-3.4 _ 
a 3.8-3.6 


32-25 


32 -a 


—> ü — 28.5 


32 


Un peso menor a 2.0 kq 

limsup. F¡ 

1.8 2 2 . 2 - 1.8 6-2 , , 

2.0 b 2.2-2.0 6 -b 

2.2 6 

24 5 

x = a- b = 28.5 -4 = 24.5 _' (100%) = 72.06% 

34 

El 72.06% de los recién nacidos aproximadamente tienen pesos entre 
2.0 kg y 3.6 kg. 


6 . ¿Qué peso acumula al 75% de los recién nacidos 


limsup. 

H, 


3.4 

73.53% 

3.8-3.4 



—^ - 

X 

75.00% 

3.8-* 

3.8 

94.12% 



94.12%-73.53% 
94.12%-75% 


—> x = 3.43kg. 


GRÁFICAS: 


Histoqrama de frecuencias 


Para construir el hlstograma de frecuencias, se coloca en el eje de la 
abscisa los Intervalos de clase, y en el eje de la ordenada las 
frecuencias que pueden ser absolutas o relativas. Al conjunto de 
rectángulos formados, se le llama hlstograma de frecuencias que 
puede ser absoluta o relativa 

Para construir el polígono de frecuencias se une los puntos medios de 
la parte superior de los rectángulos (marcas de clases) y para que este 
polígono este cerrado se crea marcas de clases ficticias, restándole a 
la primera marca de clases el valor del ancho de clase y sumándole a 
la última marca de clases el valor del ancho. Obteniéndose de esta 
manera un conjunto de líneas quebradas, llamada polígono de 
frecuencias, que puede ser absoluta o relativa. 
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Histograma de frecuencias 

fi 



Polígono de frecuencias 

f¡ 



Gráfica de la Ojiva (Menor que) 

Para construir la Ojiva en el eje de la abscisa se colocan los Intervalos 
de clases y en eje de la ordenada las frecuencias acumuladas 
absolutas o frecuencias acumuladas relativas. Por ejemplo la gráfica 
de la Ojiva para los pesos de los recién nacidos se obtiene de la 


67 


























EsTADÍSTICa DESCRiptiva V pRoBABILIDAd pARa LAS CIENCIAS DE LA INFORMAciÓn CON El USO DEl SPSS 


siguiente manera, cero recién nacidos tiene un peso menor a 1.4 kg; 2 
recién nacidos tienen un peso menor a 1.8 kg; 6 recién nacidos tienen 
un peso menor a 2.2 kg; 10 recién nacidos tienen un peso menor a 2.6 
kg; 15 recién nacidos tienen un peso menor a 3.0 kg; 25 recién 
nacidos tienen un peso menor a 3.4 kg; 32 recién nacidos tienen un 
peso menor a 3.8 kg y 34 recién nacidos tienen un peso menor a 4.2 
kg, uniendo estos puntos se obtiene la curva creciente a la derecha 
llamada Ja Ojiva( “M enor que”). _ 

F¡ 


40 



1.8 2.2 2.6 3 3.4 3.8 4.2 


Aplicando el SPSS en el cálculo y gráficos. 


Definiendo las variables 
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Ingresando los datos 


Q -Sm Mulo! [ConjuMoOotooO) - IBM Sí« SUKKi Ed«or do d«oi 


Hg O- -» >' H ffl í J vH 


1 » 

✓ «”s£d * 



- 1 « 1 • 


23 

3.2 

3.3 

3.3 







27 

» 






29 

ñ 

i 



























y» 





_ J 

i*i 

Q p 

Escribe aquí para buso 



nwi 

mwmi 



Se elabora la tabla de frecuencias para datos agrupados: 

1. Cálculo del Rango” R 

R = peso mayor -peso menor. 

R = 4.1-1.5 = 2.6 


2 . Cálculo del número de clases (K). 

K= 1 + 3.3Log(34) = 6.05388 

Como el valor que toma K debe ser un número entero, usar el 
redondeo simple (redondeo por defecto), se tiene que K = 6. 

OBSERVACIÓN 

El redondeo simple significa, que si un número tiene como 
primer decimal un número mayor o igual a 5, entonces la cifra 
entera del número se Incrementa en una unidad. 

Ejemplo: 

Si, K = 6.7, usando el redondeo simple K = 7; 

Si, K = 6.4, usando el redondeo simple K = 6; 


69 

















EsTADÍSTICa DESCRiptiva V pRoBABILIDAd pARa LAS CIENCIAS DE LA INFORMAciÓn CON El USO DEl SPSS 


3. Cálculo del ancho del intervalo de clase (A) 

El ancho del Intervalo de clase se obtiene a través de la siguiente 
fórmula: 


a =; 


R 

K 


Para los datos se tiene: 


A=^_ = 2 ^_= 0.43333 
K 6 

El valor que toma “A”, debe tener el mismo número de decimales 
de los datos originales. Por redondeo simple se tiene: 

A =0.4 

E = AK - R = 0.4(6) - 2.6 = -0.2 

Como el error es negativo, se debe incrementar en una clase 
más(k=7) 

A=TT = 0.4 


E = AK - R = 0.4(7) - 2.6 = 0.2 

Cuando el error es positivo, la tabla tendrá 7 clases y ancho 0.4 

E 0.2 

valor de arranque= dato menor - _= 1.5 — _= 1.4 

2 2 

En el menú del SPSS, escoger la opción TRANSFORMAR- 
RECODIFICAR EN DISTINTAS VARIABLES-pasar la variable peso- 
reclén-nacldo al casillero de la derecha, en la derecha en donde Indica 
variable de salida Nombre: poner peso_reclen_nacldo1 y en la etiqueta: 
poner Peso reden nacldol - PRESIONAL LA OPCION CAMBIAR- 
VALORES ANTIGUOS Y NUEVOS-RANGO-poner desde 1,4 hasta 1,8, 
luego en VALOR poner 1 y AÑADIR, así sucesivamente continua con 
todos los rangos de 3,8 hasta 4,2. 
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Aiclu» Euu. y«i Dalos Iransfonnar Analizar Gráneos Utilidades AmcUaoones ventana A,yda 



EMar Ver Dalos Iranstoimai Analizar Gráteos utilidades Ampaaoones ventana Anida 



fflU SPSS StaBdttcs Procesa or esta lisio 


I B » S f» >’ 


P fcscnbe aquí para buscar 

Cuando se termine de ingresar los rangos presionar, continuar y 
aceptar. 

Y se crea una variable Peso recien nacido 1. 
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En la variable Peso_reclen_nacldo_1, presionar la opción valores e 
Ingresar: 
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En el Menú del SPSS escoger la opción ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS-FRECUENCIA-pasar la variable Peso reden nacido 1 
al casillero derecho-ACEPTAR, y nos muestra los resultados 



Tm 


Histograma de frecuencias: En el menú del SPSS escoger la opción 
GRÁFICOS-CUADRO DE DIALOGOS ANTIGUOS-HISTOGRAMA- 
Pasar la variable Peso reden nacldol a la casilla variable y ACEPTAR 

12 Media = 4,21 

Desviación estándar = 1,629 
N = 34 



,00 2,00 4,00 6,00 8,00 


Peso recien nacidol 

Polígono de frecuencias: En el menú del SPSS, escoger la opción: 
GRÁFICOS-CUADRO DE DIALOGOS ANTIGUOS-LINEAS SIMPLES- 
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DEFINIR-pasar la variable Peso reden nacldol a la casilla eje de 
categoría y marcar N CASOS-ACEPTAR 



Polígono de la Ojiva: En el menú del SPSS, escoger la opción: 
GRÁFICOS-CUADRO DE DIALOGOS ANTIGUOS-LINEAS SIMPLES- 
DEFINIR-pasar la variable Peso reden nacldol a la casilla eje de 
categoría y marcar N ACUMULADO-ACEPTAR 



Camay Lux Palmolive Rexona 

Marca de jabón 
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Gráfica de la Ojiva (“Menor que” y “Mayor que”) 

Supongamos que la variable en estudios es el tiempo (minutos) que 
utiliza un usuario en realizar una transacción bancaria 


Tiempo 

(minutos) 

f 

h, 

Ft 

f: 

i 

H, 

2 - 4 

3 

0,10 

3 

30 

0,10 

4- 6 

6 

0,20 

9 

27 

0,30 

6- 8 

12 

0,40 

21 

21 

0,70 

8- 10 

7 

0,23 

28 

9 

0,93 

10-12 

2 

0,07 

30 

2 

1,00 

Total 

30 

1,00 





r i = valor que se obtiene, al acumular los valores de las frecuencias 

absolutas empezando por la última clase, así sucesivamente hasta 
llegar a la primera. 

De la tabla, calcular e Interpretar: 

F 2 = 9 , usuarios realizan una transacción bancaria en un tiempo 
menor a 6 minutos. 


F 4 - F 2 = 28 - 9 = 19 , usuarios realizan una transacción bancaria, en 
un tiempo mayor o Igual a 6 minutos, pero menor a 10 minutos. 

De la tabla anterior, se muestra la ojiva menor que (curva ascendente) 


F 2 =27 usuarios, realizan una transacción bancaria en un tiempo 
mayor o Igual a 4 minutos. 


-*4 =9 usuarios, realizan una transacción bancaria en un tiempo 
maypr o rauql a 8 minutos. 

F ~ F =27-9=18 usuarios, realizan una transacción en un tiempo 


mayor o Igual a 4 minutos, pero menor a 8 minutos. 


Gráfica de Ojiva menor que 
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De la tabla anterior, calcular e Interpretar: 

Gráfica de Ojiva mayor que 



Sea la tabla de distribución de frecuencias tiempo que utilizan 50 
usuarios en realizar una transacción bancada. 
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Tiempo 

(minutos) 

f 

Fi 

f: 

i 

2 - 4 

5 

5 

50 

4- 6 

10 

15 

45 

00 

1 

co 

20 

35 

35 

8- 10 

10 

45 

15 

10-12 

5 

50 

5 

Total 

50 




Cuantos utilizan un tiempo superior a los 5 minutos 


Utilizando la frecuencia absoluta menor que 

T F,j 

5 6-4 


4 

5 x 

6 15 


15 -5 


->.t=10 usuarios^ para 


6-5 15 -x 

Utilizando la frecuencia absoluta mayor que 


mayor 50 -10 = 40 Rpta. 


T 

4 

5 

6 


F*} 

45 I 6-4 


x 


J. 

6-5 


35 


35 - 45 2 _ - 10 —» x = 40 usuarios Rpta. 


35 - x 1 35 -x 


Ejemplo: 

De una muestra de tamaño 50, el dato mayor es 35 y el dato menor 5, 
determinar las clases para la tabla de distribución de frecuencias. 


R = 35-5 = 30 
K = l + 3.31og(50) = 6.6 ~ 7 
30 

A =_= 4.28 = 4 

7 

E = lx4- 30= -2 
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clases 

4-8 


A = 


30 O t , 

-g- = 3.75 = 4{ 


Ifife 

16-20 

20-24 

24-28 

28-32 

32-36 


£ = 8*4-30 = 2 
V=5- 2 _=4 

a 2 

NOTA 

La siguiente tabla permite determinar el número de clase, para 
construir la tabla de distribución de frecuencias, utilizando la formula de 
sturges. 


Tabla que proporciona el número de clases 
Para un tamaño de muestra dado 


Tamaño “n” de la 

Número de clases 

muestra 

K= 1 + 3.3Log(n) 

20 a 23 

5 

24 a 46 

6 

47 a 93 

7 

94 a 187 

8 

188 a 376 

9 

377 a 756 

10 

757 a 1519 

11 

1520 a 3053 

12 

3054 a 6135 

13 

6136 a 12328 

14 

12329 a 24770 

15 


Fuente: Elaborado por el Autor 


Ejemplo aplicativo 

La mayor y menor estatura de 50 personas son respectivamente 1.72 
mts y 1.55 mts. Calcular el número de clases y su ancho para elaborar 
la tabla de distribución de frecuencias. 


78 




















EsTADÍSTICa DESCRiptiva V pRoBABILIDAd pARa LAS CIENCIAS DE LA INFORMAciÓn CON El USO DEl SPSS 


1. Determinación de Rango R =1.72-1.55=0.17 

2. Determinación de número de clases 

K — 1+ 3.31og(50) = 6.6 = 7 , usando el redondeo simple 

3. Determinación de ancho de clase A 


0.17 

A =-= 0.0242 « 0.021 redondeo simple) 

7 

Al redondearse se comete error 
E = 0.02 * 7 -0.17 =-0.03 
Agregamos una nueva clase k — 8 
0.17 


A = 


8 


= 0.0212 « 0.02( redondeas imple) 


E = 0.02 * 8 -0.17 = -0.01 


Agregamos una nueva clase k = 9 

0.17 

A = — = 0.0188 « 0.02(re donde o simple) 

E = 0.02 * 9 -0.17 = 0.01 

dato de arranque= 1.55 -_= 1.545 ~ 1.5 5 (redondeas imple) 

2 

Los intervalos de clases para esta tabla son: 


Estaturas(mts) 

fi 

1,55-1.57 


1,57-1.59 


1,59-1.61 


1,61-1.63 


1,63-1.65 


1,65-1.67 


1,67-1.69 


1,69-1.71 


1,71-1.73 


Total 

50 
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NOTA-3 

No existe una fórmula única para determinar el número de clases (K) 
en la construcción de una tabla de distribución de frecuencias. Un 
número muy pequeño de clases tiende a ocultar la distribución real del 
conjunto de datos, mientras que un número muy grande puede dejar 
sin observaciones algunas de las clases, limitando de esta forma su 
uso. La idea es tener un número de clases de tal forma que todos los 
datos se encuentren en las clases formadas, y además nos permita 
conocer la distribución empírica de los datos. Se sugiere que el número 
de ellos debe variar entre 5 y 15. 

NOTA-4 

Para determinar el número de clases (K) también se pueden usar otras 
formulas tales como: 

K-Log 2 (n) 

K= 4n 


NOTA-5 

Para determinar el número de clases para la tabla, el Investigador 
puede utilizar el criterio anterior. 

2.6. Ejercicios Propuestos 

1. Una serie de 50 datos tiene como variable en estudio, los 
montos por ventas en miles de nuevos soles, siendo el 
monto mínimo 85 y el monto mayor 129. Establecer las 
clases para la tabla. 

2. Un conjunto de 50 datos tiene como variable en estudio 
los pesos de cajas, siendo el peso mínimo 43.43 Kg y el 
peso Máximo 68.15 Kg, Establecer las clases para la 
tabla. 

3. Los datos que a continuación se presentan, corresponden 
a una muestra aleatoria de 40 frascos conteniendo 
mermelada de fresa, el objetivo es estudiar su peso(grs.). 


149 

164 

171 

176 

156 

165 

172 

176 

157 

165 

174 

178 

158 

168 

175 

180 

162 

170 

175 

180 


181 

185 

187 

190 

182 

186 

187 

194 

183 

186 

188 

196 

183 

187 

188 

198 

184 

187 

189 

202 
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a. Elaborar la tabla de distribución de frecuencias y 
hacer los gráficos correspondientes (histograma, 
polígono y ojiva), use la regla de Sturges 

b. Hallar e interprete H 5 —H 2 , \—H A 

c. Usando la tabla de distribución de frecuencias; cual 
es el peso mínimo que debe tener un frasco, para 
estar considerado dentro del 15% de los de mayor 
peso. 

4. Los datos que presentan a continuación corresponden a 
una muestra tomada al azar de 50 personas, con el 
objetivo de estudiar la variable peso (Kg.): 


38.8 

39.7 

39.8 

42.1 

42.6 

42.8 

42.9 

43.9 

44.6 

45.3 

45.9 

46.0 

46.2 

46.4 

46.5 

46.7 

46.7 

47.0 

47.1 

47.9 

47.9 

48.6 

49.0 

49.5 

49.5 

49.5 

50.3 

50.8 

51.3 

51.3 

51.3 

52.2 

52.3 

52.4 

52.4 

52.5 

53.9 

54.0 

54.4 

54.4 

54.7 

54.7 

55.1 

55.4 

56.8 

58.0 

58.2 

59.3 

62.7 

63.3 







a. Elaborar la tabla de distribución de frecuencias. 

Usar regla de Sturges. 

b. Obtener el histograma de frecuencias absolutas y la 
ojiva. 

c. Calcular e Interpretar: 

d. f \ F \ F 5~ F 2 

e. ¿Cuántos personas aproximadamente tienen un 

peso menor a 54 Kg? 

f. ¿Cuántos personas aproximadamente tienen un 

peso superior a 52 Kg? 

g. ¿Cuántos personas aproximadamente tienen un 

peso entre 45Kg. y 50 kg? 

h. ¿Qué porcentajes de personas tienen un peso 
Inferior a 55 Kg?. 

I. ¿Cual es el mínimo peso, para que una persona se 
encuentre considerado dentro del 30% de los que 
tienen mayores pesos? 
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5. Los datos que se presentan a continuación corresponden 
a los ingresos (nuevos soles) de 45 trabajadores tomados 
al azar de una empresa. 


695.7 

721.8 

728.0 

735.7 

752.9 

758.3 

761.2 

780.1 

797.3 

805.0 

817.5 

819.2 

822.6 

830.1 

831.3 

831.6 

833.6 

842.0 

842.1 

844.9 

847.1 

869.3 

880.7 

883.9 

889.6 

895.8 

896.8 

897.4 

899.0 

919.8 

920.9 

921.5 

922.3 

929.4 

929.9 

934.3 

937.0 

946.6 

963.9 

966.8 

976.0 

977.8 

980.2 

992.2 

1001.9 





a. Elaborar la tabla de distribución de frecuencias. 

Usar la regla de Sturges. 

b. Obtener el hlstograma de frecuencias absolutas y la 
ojiva. 

c. Hallar e interprete. 

f F F -F X' 

d. 3 4 5 2 3 

e. ¿Cuántos trabajadores aproximadamente tienen un 

ingreso menor a S/. 750? 

f. ¿Cuántos trabajadores aproximadamente tienen un 

ingreso superior a S/. 850? 

g. ¿Cuántos trabajadores aproximadamente tienen un 

ingreso entre S/.850 y S/. 950? 

h. ¿Qué porcentajes de trabajadores tienen un ingreso 
inferior a 850 Kg. 

I. ¿Cuál es el mínimo ingreso, para que un trabajador 
este considerado dentro del 30% de los que tienen 
mayores Ingresos? 

6. Con la finalidad de realizar un estudio acerca de la 

cantidad (centenas de Kg) de arroz vendida por semana 
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en una tienda comercial, se tomó una muestra de 40 
semanas, obteniéndose los siguientes resultados. 

0.47 0.79 1.36 1.46 1.51 1.65 1.67 1.82 1.95 2.05 

2.09 2.12 2.16 2.24 2.25 2.27 2.30 2.36 2.47 2.48 

2.65 2.67 2.80 2.89 2.91 3.01 3.06 3.20 3.23 3.27 

3.36 3.51 3.56 3.60 3.69 3.72 3.89 4.15 4.47 5.15 


a. Construya la tabla de distribución de frecuencias, 
utilizar Sturges para determinar el número de 
clases. 

b. Hallar e Interprete: 

f F F -F X' 

3 4 5 2 3 

c. Calcular e interprete en término del enunciado los 
valores de la media, mediana y moda. 

d. De la tabla de distribución de frecuencias, estime en 
cuantas semanas de ese año, se vendieron por lo 
menos 200 Kgs, de arroz pero no mas de 350 Kg. 

e. De la tabla de distribución de frecuencias, ¿entre 
que valores se encuentra el 70% central de la 
cantidad de arroz vendido?. 


7. Se tienen conocimiento que una maquina de tejer esta 
trabajando mal, con la finalidad de conocer el numero de 
fallas por chompas se extrae una muestra aleatoria de 50 
chompas y se contabiliza en numero de fallas, los 


resultados se presenta 
2 110 
5 2 5 1 

2 2 2 2 

0 0 0 1 

2 2 2 2 


continuación: 




0 

0 

1 

0 

4 

0 

4 

1 

5 

3 

2 

3 

2 

5 

2 

5 

1 

0 

0 

1 

2 

5 

1 

3 

2 

1 

1 

1 

4 

1 
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a. Elaborar la tabla de distribución de frecuencias 

b. Visualizar la tabla a través de gráfico. 

c. Hallar e Interprete: 

/ 3 f 4 

8. Los siguientes datos corresponden a la preferencia sobre 
color de pantalones que usan las alumnas de la Pontifica 
Universidad Católica del Perú, una muestra aleatoria de 
tamaño 30 alumnas, da los siguientes resultados: 


Azul Rojo 

Verde Verde 
Negro Negro 
Verde Verde 
Rojo Belge 


Azul Azul 

Rojo Blanco 

Negro Verde 

Marrón Marrón 

Azul Negro 


Belge Verde 
Blanco Negro 
Verde Verde 
Marrón Blanco 
Marrón Belge 


a. Elaborar la tabla de distribución de frecuencias e 
interpretar. 

b. Realice el GRÁFICO correspondiente. 


9. En una encuesta realizada a 50 familias, en la cual la 
variable en estudio es el número de Integrantes de las 
familias; los resultados son: 


3 5 
3 5 
3 4 
3 4 
2 2 


6 3 

4 3 

5 3 

5 4 

4 5 


4 5 

4 5 

5 4 

3 2 

5 5 


6 3 
3 4 
3 5 
6 5 
5 3 


5 4 
5 2 
4 3 
4 4 
4 6 


a. Elaborar la tabla de distribución de frecuencias 
correspondiente 

b. Hallar e Interprete las clases formadas. 

10. Los montos diarios por ventas de una tienda comercial en 
miles de nuevos soles se presentan a continuación. 


1.23 

1.25 

1.26 

1.28 

2.58 

2.56 

2.48 

2.56 

2.56 

2.78 

2.56 

3.25 

3.25 

1.25 

2.35 

4.25 

2.35 

4.26 

4.28 

4.29 


84 



EsTADÍSTICa DESCRiptiva V pRoBABILIDAd pARa LAS CIENCIAS DE LA INFORMAciÓn CON El USO DEl SPSS 


4.35 

4.36 

2.58 

1.68 

1.59 

1.56 

1.58 

1.67 

2.70 

2.89 

2.30 

2.56 

2.89 

1.89 

1.56 

1.89 

1.56 

1.58 

1.57 

1.25 

1.23 

1.23 

2.58 

2.47 

2.31 

2.56 

4.56 

3.25 

3.24 

3.25 

3.78 

3.56 

3.01 

3.25 

3.89 







a. Elaborar la tabla de distribución de frecuencias 

b. De la tabla de distribución de frecuencias, cuantos 
montos por ventas aproximadamente, son 
superiores a los 2,000 nuevos soles 

c. De la tabla de distribución de frecuencias, cuantos 
montos por ventas aproximadamente se encuentran 
entre 2,500 nuevos soles y los 4,000 nuevos soles. 

d. ¿Que porcentajes de los montos por ventas son 
superiores a los 3,000 nuevos soles. 

e. ¿Cuál es el mínimo monto por venta, para que una 
venta este considerado dentro del 25% de los 
mayores montos. 

11. Los siguientes datos corresponden a los tiempos en 
minutos, necesario para que 50 clientes de un banco 
comercial lleven a cabo una transacción bancada: 


2.3 

2.4 

3.3 

1.8 

7.8 

3.1 

2.4 

0.4 

4.2 

6.3 

0.2 

4.4 

9.7 

4.7 

0.8 

3.7 

4.6 

1.3 

1.2 

7.6 

2.9 

5.8 

2.5 

0.7 

0.9 

7.2 

3.8 

1.1 

0.5 

1.4 

0.4 

2.8 

5.6 

6.2 

0.4 

1.6 

1.5 

5.5 

6.8 

0.5 

2.8 

3.3 

9.5 

1.2 

1.3 

1.9 

2.7 

3.4 

5.2 

1 . 4 . 


a. Construir la tabla de distribución de frecuencias 

b. Construir la Ojiva 

c. ¿Qué Porcentajes de los tiempos en atención al 
cliente son superior a los 3 minutos. 

d. ¿Que porcentajes de los tiempos de atención al 
cliente se encuentra entre 2 y 4 minutos. 

12. Los siguientes datos corresponden a los montos de 
ventas, en miles de nuevos soles, de 30 vendedores de 
una compañía de computadoras. 
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45.5 

32.8 

48.9 

51.2 

89.5 

70.9 

85.2 

70.5 

65.8 

60.4 

40.2 

29.3 

35.6 

88.2 

42.9 

26.9 

28.7 

99.8 

35.6 

37.8 

44.2 

32.3 

55.2 

50.6 

25.4 

31.7 

36.8 

45.2 

25.1 

39.7 


a. Construir la tabla de distribución de frecuencias 

b. Construir el histograma de frecuencias y la Ojiva 

c. ¿Qué porcentaje de las ventas son superiores a los 
S/.50,500 

13. Los siguientes datos corresponden a los resultados de una 
encuesta tomada a 50 usuarios sobre los servicios que 
brinda la biblioteca de cierta universidad. 

B= bueno R= regular M= malo 


B 

B 

R 

B 

M 

R 

R 

B 

B 

R 

R 

B 

R 

B 

M 

R 

R 

B 

R 

R 

R 

M 

R 

R 

B 

R 

R 

M 

R 

B 

B 

B 

B 

R 

B 

B 

B 

M 

B 

B 

B 

M 

R 

B 

M 

R 

R 

B 

R 

B 


a. Elaborar la tabla de distribución de frecuencias e 
interpretar. 

b. Realice los gráficos correspondientes. 

14. La tabla de distribución de frecuencias, corresponde a las 
edades (años) de usuarios que concurren a un centro de 
información 


Edades 

F, 

18-21 

3 

21-24 

9 

24-27 

21 

27-30 

39 

30-33 

59 

33-36 

69 

36-39 

76 

39-42 

80 

Total 



a. ¿Qué porcentajes de las edades de los usuarios 
son superiores a los 25 años? 
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b. ¿Entre que edades se encuentran el 80% central de 
las edades de los usuarios? 

c. ¿Cual es la máxima edad para que un usuario se 
encuentre considerado dentro del 20% de los 
usuarios que tienen menores edades, y cuántos son 
aproximadamente? 

15. La siguiente tabla de distribución de frecuencias, 
corresponde a los montos por ventas en miles de nuevos 
soles, de 50 tiendas comerciales dedicadas a la venta de 
abarrotes durante un mes. SI los montos por ventas se 
agrup an en 5 clases de ancho fijo igual a 5000. _ 


Montos por 
ventas 


K 

Fi 


X. 

1 




5 


21,000 




17 






35 






45 






50 



Total 







Encuentre: 

a. Complete la tabla. 

b. ¿Qué cantidad de ventas aproximadamente son 
inferiores a 30,000 nuevos soles? 

c. ¿Cuál es el mínimo monto por venta, para que una 
venta se encuentre considerado dentro del 25% de 
las ventas mayores? 

d. ¿Entre que valores se encuentran el 80% central de 
los montos por ventas? 

16. La siguiente tabla de distribución de frecuencias 

corresponden a las edades de 30 usuarios de un centro de 

Información: 


Edades 

í 

K 

F, 

H, 

x. 

[ - ) 


0.2 



23 

[ - ) 


0.5 



27 

[ - ) 


0.2 




[ - ) 






Total 

30 
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h 3 , h 4 -h 2 

a. Hallar e interprete: J2 3 ’ 4 2 

b. ¿Qué cantidad de usuarios aproximadamente tienen 
edades inferiores a los 29 años. 

c. ¿Qué cantidad de usuarios aproximadamente tienen 
edades superiores a los 30 años 

d. ¿Qué cantidad de usuarios aproximadamente tienen 
edades entre 23 y 27 años. 

e. ¿Qué Cantidad y % de usuarios tienen edades 
superiores a los 27 años? 

f. ¿Cual es la mínima edad, para que un usuario se 
encuentre considerado dentro del 20% de los que 
tienen edades mayores? 

17. La tabla de distribución de frecuencias corresponde a los 

tiempos que tarda un pedido realizado por los usuarios 

que concurren a una biblioteca. 


Tiempo 

(minutos) 

f 

h< 

Fi 

H: 

[2 - 4) 



5 


1 

ON 



16 


[6 - 8) 



32 


00 

1 

O 



44 


[10 - 12) 



50 


Total 






a. ¿Qué cantidad de usuarios reciben un pedido en 
menos de 3 minutos 

b. ¿Qué cantidad de usuarios aproximadamente 

reciben un pedido después de los 6 minutos. 

c. ¿Qué cantidad de usuarios aproximadamente 

reciben un pedido entre los 4 y 10 minutos. 

d. ¿Que cantidad y porcentaje de usuarios reciben su 
pedido entre 5 y 9 minutos? 

e. ¿Que cantidad y porcentaje de usuarios reciben su 
pedido antes de los 5 minutos o después de los 9 
minutos? 
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18. La menor edad de los usuarios que concurren a un centro 
de Información es de 18.5 años y la mayor es de 41.3 
años, si la cantidad de datos de la muestra es 70, 
establecer los Intervalos de clases. 

19. La menor edad de los usuarios que concurren a un centro 
de Información es de 16 años y la mayor es de 50 años, si 
la muestra es de tamaño 85. Establecer los Intervalos de 
clases. 

20. Una muestra de 60 alumnos arroja que la estatura menor 
es de 1.64 mts, y la mayor 1.72 mts. Establecer los 
Intervalos de clases. 

21. Una muestra de 90 alumnos arroja que la estatura menor 
es de 1.63 mts, y la mayor 1.74 mts. Establecer los 
Intervalos de clases. 

22. Una muestra de 70 tiendas comerciales arroja que el 
menor monto por venta recaudado es de S/.4,300 y el 
mayor S/.23, 

23. Una muestra de 50 alumnos arroja que el peso menor es 
de 64.5 Kg y el mayor 80.5 kg. Establecer los Intervalos 
de clases. 

24. La siguiente tabla de distribución de frecuencias 
corresponde a las edades de 50 usuarios que concurren a 
un centro de Información: 


Edades 

f 

h¿ 

F t 

H, 

X. 

1 

[ - ) 


0.04 



20 

1 - ) 


0.16 



24 

1 - ) 


0.40 



28 

I - ) 


0.24 




I - ) 


0.10 




[ - ) 


0.06 




Total 
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a. 

b. 


c. 

d. 


/ 2 , h 


H,-H, 


4> "5 ±± 2 

usuarios tienen edades 


Calcular e interprete: 

¿Qué Cantidad y % de 
inferiores a los 32 años? 

¿Qué Cantidad y % de usuarios tienen edades 
superiores a los 27 años? 

¿Cuál es la mínima edad para que un usuario se 
encuentre considerado dentro del 20% de los que 
tienen edades mayores? 


25. Los datos de la tabla, tiene como variable en estudio la 
e dad de estudiantes (años) ___ 


Edad(años) 

f t 

h, 

Ft 

H, 

X.' 

1 






14 



0.4 


0.56 

18 


12 






8 






2 





Total 







a. Completar la tabla de distribución de frecuencias 

b. Calcular e interpretar: K y 

26. La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio al número de hijos. 


X=número 
de hijos 

fi 

h, 

Ft 


1 


0.1 



2 


0.2 



3 

28 




4 

14 




5 

7 




Total 






a. Completar la tabla de distribución de frecuencias 

b. Calcular e interpretar: ^3 ^ ^4 

27. La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio los montos por ventas registrados 
durante 58 días por una tienda comercial. 
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X=montos por 
ventas (S/.) 

f 

h, 

F, 

H, 

X. 

1 




4 


900 




14 


1100 




26 






46 






54 






58 



Total 







a. Completar la tabla de distribución de frecuencias 

b. Calcular e interpretar: fu, h 2 , H 5 -H 2 , x 3 

28. Una tienda comercial registra durante 50 días los montos 
por ventas; siendo el monto menor S/.320.5 y el mayor es 
de S/.1236.4. Con esta información establecer las clases 
para elaborar la tabla de distribución de frecuencias. 


29. Sea la tabla de distribución de frecuencias 


Edad de 
estudiantes 
(años) 

í 

h, 

F t 

H, 

X. 

1 



0.10 



22.5 



0.18 



27.5 


10 




32.5 


12 






10 






4 





Total 







a. Completar la tabla 

b. ¿Qué porcentaje de estudiantes, tienen edades superiores 
a los 32 años? 

c. ¿Qué porcentaje de estudiantes, tienen edades entre los 
27 y 42 años? 
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CAPÍTULO 3 


INTRODUCCIÓN 

En este capítulo se estudia las principales medidas de tendencia 
central o de posición, las cuales se definen como aquellos valores que 
representan al conjunto de datos de la variable en estudio para la 
muestra o población. Se calculan para datos agrupados y no 
agrupados, así como también sus propiedades. 

3.1. MEDIDAS DE TENDENCIA CENTRAL O DE POSICIÓN 

Son valores estadísticos calculados con los datos de la muestra o de la 
población y que tienden a ubicarse en el centro de la distribución de los 
datos. A estas medidas se les considera como valores representativos 
para el conjunto de datos. 

SI estos valores son calculados usando los datos de la muestra, se les 
llama valores estadísticos, estadígrafos o estimados; en cambio si son 
obtenidos usando los datos de la población, se les llama parámetros. 

Las medidas de tendencia central mas usadas son: 

1. La media aritmética o simplemente media. 

2. La media ponderada 

3. La mediana 

4. La moda 

5. La media Geométrica 

6. La media Armónica 

3.2. LA MEDIA ARITMÉTICA 


Es un valor que tiende a ubicarse en el centro de la distribución 
de los datos, y es considerado un valor representativo para el 
conjunto de datos cuando los datos presentan poca variabilidad. 
Su valor se calcula tanto para la muestra (valor estadístico) 
como para la población (parámetro). Cuando la media aritmética 
se calcula utilizando datos que no se encuentran en una tabla de 
distribución de frecuencias, se dice que la media aritmética se 
obtuvo para datos sin agrupar, en caso contrario la media 
aritmética se obtuvo para datos agrupados. 
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LA MEDIA ARITMÉTICA PARA LA POBLACIÓN 


Sea X una variable en estudio que toma valores 
.x v x 2 , x 3 ,..., x N * | a mec |i a ar ¡t m ética para la población se 

simboliza unlversalmente con la letra griega ^ ( se lee “mu”) y 
es Igual a la sumatoria de todos los datos de la población 
divididos por el total de ellos. 



X; 


NOTA: El valor de la media aritmética para la población existe, pero 
casi nunca se conoce, el objetivo es estimar su valor, a través de la 
media aritmética muestral. 


Ejemplo : 

Supongamos que se tienen todos los pesos en kg de 3,546 varones 
adultos de una empresa minera, siendo estos: 

65.5 70.5 69.5 70.0 71.0 .68.5 


Calcular e Interpretar la media aritmética poblaclonal. 


3546 

X-T 


M = 


3546 


65.5 + 70.5 + 69.5 + 70 + 71+... + 68.5 
3546 


= 68.2 kg 


68.2 Kg. Es el peso promedio representativo para todos los 
trabajadores de la empresa (parámetro), esto significa que existen 
datos con pesos Inferiores o superiores al valor de la media aritmética. 


LA MEDIA ARITMÉTICA PARA LA MUESTRA 


Se X una variable en estudio que toma valores *’ 2 ’’ 3 " 

la media aritmética para una muestra se simboliza 

universalmente con la letra x ( se lee x-barra) y su valor es Igual 
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a la sumatoria de todos los datos de la muestra divididos por el 
total de ellos. 


*; 


n 

Es la media aritmética para datos sin agrupar. Al valor de la 
media aritmética, también se le conoce como la media aritmética 
muestral. 



Ejemplo 

Los siguientes datos corresponden a los pesos (kg), de 8 personas 
adultas de sexo varón: 

60.5 68.5 58,5 70.5 70.0 68.5 72.0 71.0 


Calcular e Interpretar la media aritmética. 



60.5 + 68.5 + 58.5 + 70.5 + 70 + 68.5 + 72 + 71 
6 


67AKg. 


Interpretación : 

67.4 Kg, es el peso promedio de los 8 varones adultos, este valor 
representa a cada peso de los 8 varones; esto significa que existen 
pesos Inferiores o superiores al valor de la media aritmética. 

■ PROPIEDADES DE LA MEDIA ARITMÉTICA MUESTRAL 


La media aritmética para la muestra, tiene las siguientes propiedades: 

1. Sea Tíj, X 2 , X 3 X n t una muestra de tamaño “n" y x , la 

media aritmética, definimos a una desviación como la diferencia 
entre un dato cualquiera x¡ y su media aritmética x ; es decir: 

d¡ = x¡ - x 
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2 . 


Entonces la sumatoria de todos los valores d¡ es Igual a cero; 
esto es: 

n n 

Yj d i = 2 ( x / _x ) = ° 

¿=i 1=1 

La suma de los cuadrados de las desviaciones con respecto a la 
media aritmética, es siempre un valor mínimo; es decir, 


mínimo. 



n 

Z( X -x ) 2 > 0 , es siempre un valor 

i=i ' 


3. Sea xi, X 2 , x 3 x n , una muestra de tamaño “n” y X , la media 
aritmética, sea la combinación lineal y¡ = ax¡± b ; entonces la 
media aritmética para variable Y es: 

Y=aX±b 

4. Sea una muestra de tamaño “ n ", dividida en “k” submuestra de 

tamaño n l ,n 2 ,...n k¡ y Xi, X 2 ,...,Xk, las medias 

aritméticas de cada submuestra; entonces la media aritmética 
de la muestra de tamaño de tamaño n , se calcula por: 


n 

'Yjh x¡ 



i=i 


a esta media aritmética se le conoce como la media ponderada. 
LA MEDIA ARITMÉTICA PARA DATOS AGRUPADOS 


Cuando los datos se encuentran en una tabla de distribución de 
frecuencias la media aritmética se calcula de la siguiente formula: 
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donde: 

k = Número de clases 

x¡ = Marca de clase i-éslma clase( corresponde a la ponderación) 
f = Frecuencia absoluta de la I-éslma clase 

Otra formula que se puede utilizar para calcular la media aritmética 
para datos agrupados, es en función de las frecuencias relativas: 

x = T,x h 

i i 

1=1 


Nota: 

Las propiedades de la media aritmética para datos sin agrupar, 
se cumplen también para datos agrupados. 


Ejemplo 

Sea la tabla para los datos agrupados de los pesos (kg) de los recién 
nacido. 


i 

pesos ( kg) 

f, 

h i 

F, 

H, 

i 

X 

l 

1 

1 

’oc^ 

2 

5.88% 

2 

5.88% 

1.60 

2 

[1.8-2.2) 

4 

11.76% 

6 

17.64% 

2.0 

3 

2.2 - 2.6) 

4 

11.76% 

10 

29.40% 

2.4 

4 

>6-3.0) 

5 

14.71% 

15 

44.11% 

2.8 

5 

[3.0-3.4) 

10 

29.42% 

25 

73.53% 

3.2 

6 

[3.4-3.8) 

7 

20.59% 

32 

94.12% 

3.6 

7 

[3.8-4.2) 

2 

5.88% 

34 

100 % 

4.0 

TOTAL 

34 

100 .0% 





Hallar e Interprete la media aritmética: 

T x 'f 

w f 1.60(2) + 2.0(4) + 2.4(4) + 2.8(5) + 3.2(10)+ 3.6(7) + 4(2) =2 9AKe 

~h “ 34 
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Interpretación: 

2.94 Kg. Es el peso promedio representativo para los 34 recién 
nacidos de la maternidad de Lima. Significa que en la muestra 
existen pesos inferiores o superiores al valor de la media 
aritmética. 

■ VENTAJAS Y DESVENTAJAS DE LA MEDIA ARITMÉTICA 

Ventajas 

a. Es fácil de calcular e interpretar su valor 

b. Su fórmula se presta a manipulaciones algebraicas 

c. La suma de las desviaciones es cero 

d. La suma de las desviaciones al cuadrado siempre es mínima 


Desventajas : 

a. Su valor se encuentra afectados por datos extremos (datos muy 
altos o datos muy bajo); es decir estos datos tienden a alterar su 
valor. 

b. Deja de ser un valor representativo para la muestra cuando los 
datos presentan mucha variabilidad o dispersión. 

c. No se puede calcular en tabla de distribución de frecuencias con 
extremos abiertos. 

d. Para datos con distribución asimétrica, no debe usarse como 
medida representativa. 


3.3. LA MEDIA PONDERADA 

Sea X una variable en estudio que toma los valores x 1 ,x 2 ,...,x n y sea 
los pesos o ponderaciones asociada a cada valor de la variable 
w,, w 2 w n , la media ponderada es definida como: 


n 


2 >,*, 



í=l 
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Si la ponderación es igual para todos, la media ponderada es Igual a la 
media aritmética sin ponderar. 

Ejemplo : 

En una empresa compuesta por 300 trabajadores, el ingreso mensual 
es como sigue: 250 de ellos son obreros y ganan $ 850.00, 40 

trabajan en la administración y ganan $ 950.00 y el resto son 
profesionales y ganan $ 1500.00. Hallar e interprete el ingreso 
promedio para los trabajadores de la empresa. 

El enunciado presentado en la tabla: 


i 

Trabajadores 

Ponderación! w¡) 

sueldo( x¡) 

1 

Obreros 

250 

850.00 

2 

Administrativos 

40 

950.00 

3 

Profesionales 

10 

1500.00 


Total 

300 



É-,x, 



i= 1 


Interpretación: 


250(850.00) + 40(950.00) + 10(1500) 


250+40 + 10 


= $ 885.00 


$.885.00, es el Ingreso promedio para los trabajadores de la empresa. 


3.4. LA MEDIANA 


Es una medida de tendencia central, que divide al conjunto de 
datos ordenados de la muestra, en dos partes ¡guales; es decir el 
50% de los datos tendrán valores menores o ¡guales al valor de 
la mediana y el otro 50% de los datos con valores superiores al 
valor de la mediana. 

CÁLCULO DE LA MEDIANA PARA DATOS SIN AGRUPAR 

Sea X una variable en estudio que toma los valores 


•Áq •> v 


X 


, para calcular el valor de la mediana, se 


ordenan los datos en magnitud en forma ascendente o 
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descendente, para calcular la mediana debemos tener en cuenta 
si el número de datos es par o Impar; es decir: 


n 


par —» me 


X H 

iJ 

:D 22 


+ X 


f-+l) 


( 1 ) 


Donde: 


n = impar —> me = x ^ 


2 


( 2 ) 


x (i ) = valor que toma la variable X en la posición “i” 

El valor de la mediana es útil como medida representativa para el 
conjunto de datos, cuando estos no tienen un comportamiento 
homogéneo. 


Elemplo-1 


La cantidad de estudiantes que concurren a un centro de Información 
durante la semana es: 


230 220 250 228 240 1200 

Hallar el valor de la mediana de la concurrencia de estudiantes 
Ordenando los datos en forma ascendente: 


220 228 230 240 250 1200 


Utilizando la fórmula (1), por tener un número par de datos 


» = 6 —> me = JC<3> +A|41 _ 230+240 
2 2 


235 


estudiantes 


Interpretación: 

El 50% de los estudiantes que concurren al centro de Información 
durante los días de la semana es menor o Igual a 235, y el otro 50% de 
los estudiantes es superior a 235. 
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Elemplo-2 

Sea la serie de datos: 5, 3,2,1,2, 5, 4, 3, Hallar la mediana 
Ordenando los datos en forma ascendente:: 1,2, 2, 3, 3, 4, 5,5 

Como n = 8 (número de datos par), entones: 

x 4 + x 5 3 + 3 0 

me = — -- =- = 3 

2 2 
Interpretación 

El 50 % de los datos son menores o ¡guales a 3 y el otro 50 % son 
superiores a 3. 

Elemplo-3 

Hallar e Interprete el valor de la mediana para las estaturas (mts) de 7 
personas adultas. 

1.71 1.69 1.72 1.69 1.68 1.70 1.73 

Ordenando las estaturas: 

1.68 1.69 1.69 1.70 1.71 1.72 1.73 

Como n = 7, entonces: me ~ 7+1 — X 4 = 1.70 

( — ) 

2 

Interpretación: 

El 50 % de las personas adultas tienen estaturas menor o ¡guales a 
1.70 mts, y el otro 50 % de los Cadetes tienen estaturas superior a 
1.70 mts. 

■ CÁLCULO DE LA MEDIANA PARA DATOS AGRUPADOS 

PARA UNA VARIABLE CUANTITATIVA DISCRETA Y 

CONTINUA 


PARA UNA VARIABLE CUANTITATIVA DISCRETA 

Ejemplo 
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En la siguiente tabla de distribución de frecuencias, la variable en 
estudio X corresponde al número de balones de gas vendidos 
diariamente por 50 tiendas. Hallar el valor de la mediana del 
número de balones de gas vendido diariamente. 


X¡ 

/, 

22 

9 

23 

10 

21 

6 

25 

7 

26 

5 

24 

13 

TOTAL 

50 


Ordenando (de menor a mayor) los valores que toma la variable X, y 
obtenemos el valor de las frecuencias absolutas acumuladas. 


i 

x¡ 

fi 

Fi 

1 

21 

6 

6 

2 

22 

9 

15 

3 

23 

10 

25 (xi6 —> T 25 ) 

4 

24 

13 

38 (X26 —» T38) 

5 

25 

7 

45 

6 

26 

5 

50 

TOTAL 

50 



x~,c+x~,, 23 + 24 

n = 50 ( par ) —> me = ' ~ 6 =_ = 23.5 

2 2 

Interpretación: 

El 50% de las tiendas tienen una venta diaria menor a Igual a 23.5 
balones de gas, y el otro 50% de las tiendas tienen una venta diaria 
mayor a 23.5 balones de gas. 

PARA UNA VARIABLE CUANTITATIVA CONTINUA 


Cuando los datos se presentan en una tabla de distribución de 
frecuencias, para una variable continua, el valor de la mediana se 
calcula haciendo uso de la siguiente formula: 
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me = LI¡ + (—-)* A 

f, 

Donde: 

L/ ; =L¡m¡te inferior de la clase que contiene al valor de la mediana 
F l , =Frecuencla absoluta acumulada de la clase anterior a la clase 
que contiene al valor de la mediana 
/,=Frecuencla absoluta de la clase que contiene al valor de la 
mediana 

A =Ancho del Intervalo de clase. 

Para ubicar la clase que contiene el valor de la mediana se busca en la 
columna de la frecuencias absoluta acumulada o frecuencias relativa 
acumulada (F¡ o H¡, ) el primer valor que sea mayor o Igual a la 
mitad del número de datos o al 50% de los mismos; es decir, 

F > n 

t ¡ - o H¡> 0.5 
2 

Otra fórmula que se puede utilizar para calcular la mediana para 
datos agrupados, en función de las frecuencias relativas: 

me = U , + ( °' 5 ~ H '- ' )* A 
h ¡ 

Elemplo-1 

Hallar e Interprete el valor de la mediana para la tabla de datos 
agrupados de los recién nacidos. 


i 

pCSOS (k g) 

/, 

k i 

F, 

H, 

? 

X 

l 

1 

1 

’oc^ 

2 

5.88% 

2 

5.88% 

1.60 

2 

[1.8-2.2) 

4 

11.76% 

6 

17.64% 

2.0 
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3 


2.2 - 2 . 6 ) 

4 

11.76% 

10 

29.40% 

2.4 

4 


2.6 - 3 . 0 ) 

5 

14.71% 

15 

44.11% 

2.8 

5 


3 . 0 - 3 . 4 ) 

10 

29.42% 

25 

73.53% 

3.2 

6 


>. 4 - 3 . 8 ) 

7 

20.59% 

32 

94.12% 

3.6 

7 


3 . 8 - 4 . 2 ) 

2 

5.88% 

34 

100% 

4.0 

TOTAL 

34 

100.0% 





— 77 -- —34 -—----- 

F>^F> -> F > 17 , entonces la 5ta clase contiene al valor de 


¿ 2 ‘2 

la mediana (i = 5) 

me = U +(^~ F 5 _ l )A = 3+17 _ 15 )( 0 - 4 ) = 3.0SKg. 


Interpretación: 

El 50% de los recién nacidos tienen pesos menores a ¡guales a 3.08 Kg 
y el otro 50% de los recién nacidos tienen pesos superiores a 3.08 Kg. 

■ VENTAJAS Y DESVENTAJAS DE LAMEDIANA 
Ventajas 

1. Es fácil de calcular e Interpretar su valor 

2. Se realizan manipulaciones algebraicas. 

3. Su valor no se encuentra afectado por datos extremos. 

4. Se puede calcular en tablas de distribución de frecuencias con 
extremos abiertos 

Desventaja 

La suma de los cuadrados de las desviaciones con respecto a la 
mediana no es mínima, en comparación con la media aritmética. 

■ PROPIEDADES DE LA MEDIANA PARA UN CONJUNTO DE 

DATOS TRANSFORMADOS 

Sea x\, X 2 , X 3 x n , una muestra de tamaño “"n" y m e , el valor de 

la mediana, sea la combinación lineal y¡= ax¡± b ; entonces el nuevo 
valor de la mediana para la variable Y es: 
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m = am ± b 

«J «X 

Siendo:a y b constantes. 

Ejemplo-1 

Un conjunto de 20 datos tiene por mediana 24, si al conjunto de datos 
se le incrementa en un 15% más 3 unidades. Hallar el nuevo valor de la 
mediana. 

Sea el , valor del I-esimo datos, por el enunciado del problema el 
valor del iesimo dato transformado es y,= 1.15x,+3 y por la 
propiedad de la mediana, su nuevo valor es: 

m e = 1 . 15 ( 24 )+ 3 = 30.6 

Ejemplo-2 

Sea la tabla de distribución de frecuencias 


Edad 

fi 

Fi 

x t 

18-22 

4 

4 

20 

22-26 

13 

17 

24 

26-30 

19 

36 

28 

30-34 

12 

48 

32 

34-38 

5 

53 

36 

Total 

53 




De la tabla, si las edades de las 53 personas se Incrementan en un 
12% mas 2 años, calcular el nuevo valor de la mediana. 


De la tabla calculamos el valor de la mediana. 

^ , 26.5 - 17^ „ 

= 26 + (_ ) * 4 


m„ 


19 


28 años 


Sea el x'¡ , valor de la i-ésima marca de clase para la tabla, por el 

enunciado del problema el valor de la i-ésima marca de clase 
transformada es y =1.12x +2 y por la propiedad de la mediana, 

i i 


su nuevo valor es: 

i n =1.12»i+2 = 1.12(28)+ 2 = 33.36 


años 
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3.5. LA MODA 

Sea X una variable en estudio que toma los valores 
x l , x 2 x n , la moda, es aquel valor de la variable que se 
presenta con mayor frecuencia, se representa por (m 0 )\ es decir, 

mo = valor que toma la var iable para la max ima frecuencia ( f¡) 

El valor de la moda se Interpreta como el valor mas frecuente 
para el conjunto de datos de una muestra o población. 

El valor de la moda puede o no existir. SI un conjunto de datos 
tiene una sola moda a su distribución se le llama unlmodal, si 
tiene dos modas se le llama blmodal y para más modas 
multlmodal 

Elemplo-1 

Hallar la moda para el conjunto de datos 

12, 16, 18, 18, 18, 20, 20, 20, 20, 20, 20, 24 

El dato que se repite con mayor frecuencia es el valor 20, luego la 
moda es 20. 

Elemplo-2 

Calcular la moda para la serie de datos 
1,1, 1,3, 3,4,3 

Los datos que se repiten con igual frecuencia son el 1 y 3, luego la 
distribución tiene dos modas 1 y 3. 

Elemplo-3 

Calcular la moda para el conjunto de datos: 4, 2, 3, 7, 5, 9 

Como no existe ningún dato que se repite más de una vez, luego el 
conjunto de datos no tiene moda. 
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Elemplo-4 

Una tienda vende durante el día tres tipos de conservas: 120 frascos 
con fresa, 40 frascos con durazno y 50 frascos con piña. Calcular el 
tipo de conserva más vendida. En este ejemplo la variable en estudio 
es tipo de conservas; luego los frascos con fresas registraron la mayor 
frecuencia en venta 

■ CÁLCULO DE LA MODA PARA DATOS AGRUPADOS 


Cuando los datos se encuentran en una tabla de distribución de 
frecuencias, la formula para calcular la moda es: 


Donde: 


mo = LI¡ + (———)A 
cl\ d 2 


LI ,= Limite Inferior de la clase que contiene al valor de la moda. 

d\ =f ~ f¡- 1 = Diferencia entre la frecuencia absoluta de la 

clase modal y la frecuencia absoluta de la clase 
anterior. 

d 2 = fi - f+ 1 = Diferencia entre la frecuencia absoluta de la 

clase modal y la frecuencia absoluta de laclase 
siguiente. 

A = Ancho de clase 

La clase modal corresponde a la clase de mayor frecuencia absoluta o 
mayor frecuencia relativa. 

Otra fórmula que se puede utilizar para calcular la moda para datos 
agrupados, es en función de las frecuencias relativas: 

rr / d,l n 

mo = LI¡ + (- 1 - )A 

d x /n + d 2 / n 

LI ,= Límite Inferior de la clase que contiene al valor de la moda. 
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d 1 


n 


= h¡ - K\ = 



n 


h = 

i +1 


Diferencia entre la frecuencia relativa de la 

clase modal y la frecuencia relativa de la clase 
anterior. 


Diferencia entre la frecuencia relativa de la 

clase modal y la frecuencia relativa de la clase 
siguiente. 


La clase modal corresponde a la clase de mayor frecuencia relativa. 


Ejemplo 

De la tabla de distribución de frecuencias, en la cual se analiza los 
pesos de los recién nacidos. Hallar e Interprete el valor de la moda. 


i 

P6SOS (k g) 

f, 

k i 

F, 


? 

X 

l 

1 


i i 

4 ^ 

1 

'oc^ 

2 

5.88% 

2 

5.88% 

1.60 

2 


1.8 - 2.2) 

4 

11.76% 

6 

17.64% 

2.0 

3 


2.2 - 2 . 6 ) 

4 

11.76% 

10 

29.40% 

2.4 

4 


2.6 - 3 . 0 ) 

5 

14.71% 

15 

44.11% 

2.8 

5 


3 . 0 - 3 . 4 ) 

10 

29.42% 

25 

73.53% 

3.2 

6 


3 . 4 - 3 . 8 ) 

7 

20.59% 

32 

94.12% 

3.6 

7 


3.8 - 4 . 2 ) 

2 

5.88% 

34 

100% 

4.0 

TOTAL 

34 

100.0% 





El valor de la moda se encuentra en la 5ta clase, por presentar la 
máxima frecuencia absoluta, en este caso la distribución es unimodal 
para esta muestra, luego (I = 5) 

d,= f~ f^ = f 5 ~f<= 10-5 = 5 
d 2 =fi~f M = f 5 -f 6 = 10-7 = 3 
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mo = LI 5 + (—^—)A = 3 + ( 5 ) * 0.4 - 3.25 Kg. 
d\ + 6?2 5+3 


Interpretación: 3.25 Kg. Es el peso mas frecuente para los recién 
nacidos. 

■ PROPIEDADES DE LA MODA PARA DATOS 
TRANSFORMADOS 


Sea xi, X 2 , xj ,..., x n , una muestra de tamaño 


de datos 


cuantitativos y m o , el valor de la moda, sea la combinación lineal 

y¡ = ax¡± b ; entonces el nuevo valor de la moda para la variable Y 
es: 


m = am ± b 


O 


O 


Siendo: a y b constantes. 


3.6. LA MEDIA GEOMÉTRICA 

Es otra medida de tendencia central, y se utiliza cuando se desea 
promediar tasas de cambio o proporciones. Para un conjunto de 
datos x 1 ,x 2 ,x 3 ,...,x„, \/x¡> 0 la media geométrica se define 

como la raíz enésima del producto de las observaciones; es 


decir, 



1 " 

x g = Anti log(~ y^logx¿) 


í=1 


Para datos agrupados la fórmula para calcular la media 
geométrica es: 


Xg = ’yl C*i) %X ) 2 .á )... ( f bc ) k fk 


L i_ 

x g - Antilogi f¡ .log x¡ ) 
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Siendo: X. = va | 0 r de la i-ésima marca de clase 

fi=v alor de la i-ésima frecuencia absoluta. 

n = ±f 

;=i 

Eiemplo-1 

Una país tiene una población en el año 1980 de 8 millones de 
habitantes, en el año 1990 fue de 9.2 millones y en el año 2000 de 
10.58 millones. Hallar la población media para esos tres años y el 
Incremento anual. 

Cálculo de la población media 

x g = ^8)(9.2)(10.58) = 9.2 Millones de habitantes es la población 
media 


Cálculo del Incremento anual promedio 


x g = 


9 . 2 ', 10.58 
8 9.2 


10.58 

8 


1.15 -> 115 % 


15% es el Incremento anual promedio de la población para los 3 años. 
Elemplo-2 

Las cantidades de artículos vendidos durante los años 1974 al 1976 
por la empresa DURAPLAS, se presenta en la siguiente tabla: Hallar el 
Incremento promedio anual 


Años 

Cantidad producida 

Variación anual 

1974 

200 


1975 

400 

2.0 

1976 

600 

1.5 


La variación anual promedio 


x s =^2)(1.5) =1.7320 

El Incremento anual promedio es 1.732-1=0.732 en % es 73.20% 
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E¡emplo-3 


Hallar el promedio geométrico de las siguientes cantidades 


8 


40 200 1000 


^8)(40)(200)(1000) = 89.4427 


Ejemplo-3 

Calcular el promedio geométrico de las siguientes cantidades: 


4, 8, 16, 32 


x s = t/4)(8)(16)(32) = 11.314 


3.7. LA MEDIA ARMÓNICA 

Se utiliza para promediar razones que tienen dimensiones físicas, 
tales como km/hora, promediar el costo medio de artículos 
comprados con una cantidad fija de dinero. La media Armónica 

para n valores x¡> 0 , se define como el recíproco de la media 
aritmética de los recíproco de los datos. 


n 


— + — + ■■■ +- 

*1 *2 


Para datos agrupados 


Xa 


n 



Siendo: 


y 

i = valor de la i-esima marca de clase 
f = valor de la frecuencia absoluta de la i-esima 


clase 


k 



i= 1 
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Elemplo-1 

Tres vehículos recorren cierto tramo de una autopista con las 
siguientes velocidades: 90 km/hora, 110 km/hora y 140 km/hora. Hallar 
la velocidad media. 

~Xa= ^ = 109 . 7097 km/hora 

1 1 1 

90 110 140 

E¡emplo-2 

Una persona concurre a tres mercados para consultar el precio de un 
artículo determinado llevando consigo la suma de 24 nuevos soles. En 
el primer mercado pude comprar 4 artículos; en el segundo 5 artículos 
yen el tercero 6 artículos. Hallar el precio promedio del artículo. 


Cantidad de artículos que puede 
comprar con los 24 nuevos soles 

Precio unitario del articulo 

4 

6.0 

5 

4.8 

6 

4.0 



6 4.8 4 


S/. 4.8 es el precio promedio del artículo. 

Elemplo-3 

Un representante del INEI, con la misma cantidad de dinero, compra en 
diferentes establecimientos cantidades de un mismo artículo, tal como 
se muestra en la tabla siguiente. Hallar el precio promedio del artículo 
en los diferentes lugares. __ 


Dinero 

Cantidad de artículo 
comprado 

Precio unitario por 
artículo 

20 

10 

2 

20 

8 

2.5 

20 

14 

1.42857 
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x a =j — T - 3 -j- = 5/.1.875 

2 + Z5 + 1.42857 

Ejemplo-4 

Sean a y b dos números enteros positivo, probar que: 

X > X o > X a 


Demostración 

sean a y b e R + 

Entonces: 


(Ja -Jb ) 2 >0 


a 


+b - ijab > 0 


a + 


b>lJab 


a + b 


> Job 


x>x g 


( 1 ) 


También 

( 4 = ^0 

■Ja Jb 

J_ + 1__ 2 2 - 1 < dab 


► Xa < X . 


b yfab 


b -Job 


1 1 

— + — 

a b 


1 1 

— + - 

a b 


'Job 


( 2 ) 


de (1) y (2) x > x,> 


x a 


demostrado 


Aplicando el SPSS para datos no agrupados Media, Mediana, Moda 
Definiendo las variables 
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ti 'Sin tfadol | ConjuratoDetosO ¡ - IBM SPSS Stebst.es Edito, de délos - O 



Ingresando los datos 

ti *Sntitulo’ ICorrumoOetosO] - IBM SPSS Stehsbcs E*»cr de ditos 


^ H ¡3 B5 «• -* II 13 .,1 oí* 



Calculando la Media, La Mediana y la Moda 
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En el Menú del SPSS escoger ANALIZAR-ESTADISTICOS 
DESCPRITIVOS-FRECUENCIAS-pasar la variable 


Peso_reclen_nacldo a la casilla de la derecha-ESTADISTICOS-marcar 
media, mediana y moda-CONTINUAR-ACEPTAR 

aicíuvo gMM yer Qaios Iransfonn» inali ai GrMcos yniidan 


3 B i E! HÍb^§P W 11 jÍoH 


le z de 2 variables 



Estadísticos 


Peso reden nacido 


N Válido 

34 

Perdidos 

0 

Media 

2,921 

Mediana 

3,100 

Moda 

3,2 


Para el cálculo de la Media Geométrica, Media Armónica, con los 
mismos datos ya Ingresados en el menú del SPSS escoger: 
ANALIZAR-I INFORMES-RESUMENES DE CASOS- pasar la variable 
Peso_reclen_nacldo a la casilla de la derecha -ESTADISTICOS y 
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seleccionar media armónica, media geométrica y pasar a la casilla de 
la derecha-CONTINUAR-ACEPTAR 


Q Pilo « JIM««.PC „ |LOTV-O0-«I| VM P. a-M-i L. , 

«Olivo tonal im Datos Iranstcvnar falcar Gráteos l?tiliOaoss «niMiaaonís ventana 

IBS B8 g- £jÉe< P M ¡lü J oB 



Vísta He dalo» Vl«* 0* varales 


P Escribe aquí para buscar 


o =• eapliiagn 


IBM SPSS SMstcs Procenor «tU tuto Unicode ON 



Resúmenes de casos 

Peso recien nacido 


Media 

Media 

armónica 

geométrica 

2,748 

2,839 


Para datos agrupados 

Se elabora la tabla de frecuencias para datos agrupados: 

4. Cálculo del Rango” R 

R = peso mayor -peso menor. 

R = 4.1 -1.5 = 2.6 
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5. Cálculo del número de clases (K). 

K= 1 + 3.3Log(34) = 6.05388 

Como el valor que toma K debe ser un número entero, usar el 
redondeo simple (redondeo por defecto), se tiene que K = 6. 

OBSERVACIÓN 


El redondeo simple significa, que si un número tiene como 
primer decimal un número mayor o Igual a 5, entonces la cifra 
entera del número se Incrementa en una unidad. 

Ejemplo: 

SI, K = 6.7, usando el redondeo simple K = 7; 

SI, K = 6.4, usando el redondeo simple K = 6; 

6. Cálculo del ancho del intervalo de clase (A) 

El ancho del Intervalo de clase se obtiene a través de la siguiente 
fórmula: 



K 


Para los datos se tiene: 

A= R L = 2 J 6 _= 0.43333 
K 6 

El valor que toma “A”, debe tener el mismo número de decimales 
de los datos originales. Por redondeo simple se tiene: 

A =0.4 

E = AK - R = 0.4(6) - 2.6 = -0.2 

Como el error es negativo, se debe Incrementar en una clase 
más(k=7) 

A — — 0.4 

7 

E = AK - R = 0 . 4 ( 7 ) - 2.6 = 0.2 

Cuando el error es positivo, la tabla tendrá 7 clases y ancho 0.4 
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valor de arranque— dato menor - _= 1.5 — _= 1.4 

2 2 

En el menú del SPSS, escoger la opción TRANSFORMAR- 
RECODIFICAR EN DISTINTAS VARIABLES-pasar la variable peso- 
reclén-nacldo al casillero de la derecha, en la derecha en donde Indica 
variable de salida Nombre: poner peso_reclen_nacldo1 y en la etiqueta: 
poner Peso_reclen_nacldo1 - PRESIONAL LA OPCION CAMBIAR- 
VALORES ANTIGUOS Y NUEVOS-RANGO-poner desde 1,4 hasta 1,8, 
luego en VALOR poner 1 y AÑADIR, así sucesivamente continua con 
todos los rangos de 3,8 hasta 4,2. 



im SPSS Swosacs Piocessoi esta lisio umcoaeON 


I P Escribe aquí paia buscar 


a a h • a t* 
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Estar yti Dalos Iranstormai Anomai Gi ateos utilidades Ampaaoones 





I P Escribe aquí para buscar 


)M SPSS Staestes Procesal» esta listo Unicode ON 


e ib d i w J a ^ * i « i|''c«ivq 


Cuando se termine de ingresar los rangos presionar, continuar y 
aceptar. 

Y se crea una variable Peso recien nacido 1. 


Q -Sin Mulo I [ComuntoOetoiO] - IBM SPSS Stalistics Editor de dalos 

«entro EflUar x» pata» Iranstormar awar Grádeos uwaadoa Ampaaaones voniana «mas 


E3 H H 9 isJ O 

H 



_ 

Homar 

Pe*o_reaen_nacido 

Tipo Anchura Oecimales Etiqueta Valores 

rtumonco t 1 Peso recién na Ninguna 

Perdidos 

Ninguna 

Columnas 

a 

Alineación Medida 

a Derecha / Escala 

Rol 

^ Emiada 

I 2 

Peso_recien_noc«lo1 

Numenco 1 2 Peso ración na Ninguna 

Ninguna 

21 9 Derecha dC Nomnat 

S Emrada 

































































































. ” 














vista oo nao 

... l>n 

i Vista de venables 





IBM SPSS Sta listes procassor está 

lisio UnlcodeON 

° Esci'be aquí para iiuk-ji 

= e n m o tí 

U-ft 

iBfTmrwmrBTiB 
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En la variable Peso_reclen_nacldo_1, presionar la opción valores e 
Ingresar: 

O 



Y Poner aceptar. 

En el Menú del SPSS escoger la opción ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS-FRECUENCIA-pasar la variable Peso_reclen_nacldo 
1 al casillero derecho-ACEPTAR, y nos muestra los resultados 



Calculando la Media, La Mediana y la Moda 
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En el Menú del SPSS escoger ANALIZAR-ESTADISTICOS 
DESCPRITIVOS-FRECUENCIAS-pasar la variable 
Peso_reclen_nacldo1 a la casilla de la derecha-ESTADISTICOS- 
marcar media, mediana y moda-CONTINUAR-ACEPTAR 

tí 



Estadísticos 


Peso reden nacldol 


N Válido 

34 

Perdidos 

0 

Media 

4,2059 

Mediana 

5,0000 

Moda 

5,00 


Para el cálculo de la Media Geométrica, Media Armónica, con los 
mismos datos ya Ingresados en el menú del SPSS escoger: 
ANALIZAR-INFORMES-RESUMENES DE CASOS- pasar la variable 
Peso_reclen_nacldo1 a la casilla de la derecha -ESTADISTICOS y 
seleccionar media armónica, media geométrica y pasar a la casilla de 
la derecha-CONTINUAR-ACEPTAR 
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tá 


Resúmenes de casos 

Peso recien nacidol 


Media 

Media 

armónica 

geométrica 

3,2949 

3,8083 


3.8. Ejercicios Propuestos 

1. Los siguientes datos corresponden a pesos ( Kg) de 20 
alumnos. 


50.5 

54.5 

52.4 

54.5 

55.0 

61.5 

61.0 

60.0 

62.0 

58.5 

51.4 

52.5 

62.5 

50.5 

50.0 

50.5 

52.5 

58.5 

64.2 

50.5 


a. Hallar e interprete la media aritmética, mediana y moda. 
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b. Si los pesos de los alumnos se incrementan en un 15 % 
mas % Kg. Hallar el nuevo peso promedio y el peso 
mediano. 


2. La siguiente tabla de distribución de frecuencias proporciona los 
montos por venta en cientos de nuevos soles de un grifo. 


Montos 

por 

Ventas 

10-15 

15-20 

20-25 

25-30 

30-35 

35-40 

f 

12 

15 

20 

25 

12 

8 


a. Hallar e Interprete la media aritmética, mediana y moda. 

b. SI los montos por ventas se incrementan en 12%. Hallar el 
monto promedio y el monto mediano. 


3. 


La tabla de distribución de frecuencias tiene como variable en 


Estatura 

(mts) 

f 

K 

F, 

H, 

X. 

1 

1.67-1.69 

5 





1.69-1.71 

9 





1.71-1.73 

12 





1.73-1.75 

10 





1.75-1.77 

9 





1.77-1.79 

5 





Total 

50 






Calcular e interprete: 

a. ,/j ; h s ; F 2 ', T/ 3 ; H 5 H 2 ', x 3 

b. La estatura media, mediana y modal de las personas. 


4. El promedio de 10 calificaciones del curso de estadística en un 
salón de clase es de 9.8; pero al ingresar los datos a la 
computadora en lugar de digitar 14 se dígita 4, y en lugar de 
digitar 8 dígita 12. Calcular la nueva nota promedio con estas 
correcciones. 


5. De la siguiente tabla de distribución de frecuencias Hallar la 
media aritmética, mediana, media geométrica y medlaarmónica. 
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Montos 

por 

ventas 

en 

/, 

k i 

F, 

H, 

1 

X 

l 

18.5-23.5 

5 





23.5-28.5 

11 





28.5-33.5 

20 





33.5-38.5 

10 





38.5-43.5 

4 






50 






6. Un centro de información realizó durante los últimos 4 años las 
siguientes adquisiciones de revistas científicas: 30, 25, 20, 15, si 
el presupuesto para la adquisición se ha mantenido durante los 4 
años. Hallar el promedio de revistas adquiridas por año. 

7. La media aritmética de dos números es 10 y su media 
geométrica 8, Hallar su media armónica. 

8. La población de un país en el año 1990 fue de 23,5 millones de 
habitantes, en el año 1995 fue de 25.6 millones de habitantes y 
en el año 2000 de 27.9 millones de habitantes. Hallar la 
población media para esos tres años. 

9. Un centro de investigación ha experimentado un incrementado 
en la producción de revistas científicas tal como se detalla: 12% 
en el año 2000, 8% en el año 2001 y 14 % en 2002. Hallar el 
promedio de crecimiento anual. 

10. La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio al número de hijos. 


número de 
hijos 

f, 

h, 

F, 


1 


0.1 



2 


0.2 



3 

28 




4 

14 




5 

7 




Total 






Calcular: 


x, me, m () 
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11. Los siguientes datos corresponden a edades (años) de alumnos 
de instrucción primaria. 

12 14 12 12 13 14 15 12 14 14 

Hallar la media, mediana y moda de las edades de los 
alumnos. 

12. De la pregunta anterior, calcular la media, mediana y moda 
después de 5 años. 

13. Los datos de la tabla, tiene como variable en estudio la edad de 
estudiantes(años) 


Edad 

(años) 

f¡ 

h, 

Fi 


X. 

1 






14 



0.4 


0.56 

18 


12 






8 






2 





Total 







a. Completar la tabla de distribución de frecuencias 

b. Hallar la media, mediana y moda de las edades de los 
estudiantes. 


14. La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio al número de hijos. 


número de 
hijos 


h, 

F t 

H, 

1 


0.1 



2 


0.2 



3 


0.4 



4 


0.2 



5 


0.1 



Total 






Hallar la media, mediana y moda de la variable número de hijos 

15. La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio a los montos por ventas registrados por una 
tienda comercial. 
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Montos por 
ventas (S/.) 

/ 

h, 


H, 

x' 

l 

4,500 - 6,000 


0.15 




6,000 - 7,500 


0.20 




7,500 - 9,000 


0.45 




9,000 - 10,500 


0.12 




10,500- 12,000 


0.08 




Total 







Hallar la media, mediana y moda de los montos por ventas. 


16. La tabla contiene datos de los tlempos(minutos) registrados en 
_ atender a los usuarios que concurren a un centro de información: 


X=T¡empo (minutos) 

f, 

h, 

Fi 


X. 

l 

0.5 - 1.0 


0.10 




1.0 -1.5 


“a” 




1.5 - 2.0 


0.35 




2.0 - 2.5 


“b” 




2.5 - 3.0 


0.1 




Total 







a. Si la media aritmética es 1.75, completar la tabla. 

b. Hallar la moda y mediana del tiempo de atención a los 
usuarios que concurren al centro de Información. 

17. El valor de la mediana para un conjunto par de datos es 20. Si 
los datos se Incrementan en 20% más 4 unidades. Hallar el 
nuevo valor de la mediana. 


18. La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio la edad (años) del jefe de familia. _ 


Edades (años) 

f 

K 

F t 

H, 

x. 

i 

24- 28 

5 





28- 32 

20 





32- 36 

10 





36 - 40 

20 





40 - 44 

5 





Total 

60 






Hallar: la media, mediana, moda de las edades del jefe de familia. 
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19. La siguiente tabla de distribución de frecuencias, tiene con 


variable en estudio al número de artículos 

por revistas científicas 

Número de 
artículos 

f 

h, 

Ft 

H, 

15 

12 




9 

8 




10 

15 




14 

18 




18 

7 




Total 

60 





Hallar la media, mediana moda del número de artículos por 
revistas. 
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CAPÍTULO 4 

MEDIDAS DE VARIABILIDAD O DISPERSIÓN 


INTRODUCCIÓN 

En este CAPÍTULO se estudiarán las medidas estadística de 
variabilidad o dispersión para un conjunto de datos; si los datos fuesen 
¡guales, se dice que no existe variabilidad o dispersión entre ellos, en 
caso contrario se dice que los datos presentan dispersión o 
variabilidad. El estudio de la variabilidad de un conjunto de datos es de 
suma importancia en todo análisis estadístico ya que de esto depende 
el grado de confiabilidad de las estadísticas que se calculan.. 

Las medidas de variabilidad o dispersión se clasifican en: 

• MEDIDAS DE VARIABILIDAD ABSOLUTAS 

Cuando su valor esta expresado en la misma unidad de medida de los 
datos originales. Las principales medidas de variabilidad absolutas son: 

1. Rango 

2. Variancia o Varianza 

3. Desviación estándar 

• MEDIDAS DE VARIABILIDAD RELATIVA 

Cuando su valor carece de unidad de medida; la medida de variabilidad 
relativa que se usará es: El Coeficiente de variación o variabilidad 

4.1. EL RANGO 

El rango es una medida (distancia), a través de la cual se 
distribuyen todos los datos de la muestra o población. Se calcula 
por la diferencia entre el dato mayor y dato menor que toma la 
variable. Un valor del rango diferente de cero nos indica la 
presencia de variabilidad de los datos, mas no nos indica acerca 
de la variabilidad interna entre los datos. 

Para datos sin agrupar: Rango = Dato mayor— Dato menor 

Para datos agrupados: Rango = LS k — LI { 

Donde: 

LS k = límite superior de la última clase 
L7, = límite inferior de la primera clase 
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Ejemplo: 

Sean los montos por ventas de una tienda comercial expresada en 
nuevos soles: 

1500 2300 1800 2000 1500 2400 

2300 1000 1200 2400 2500 1800 


De acuerdo con la definición el rango es: 

Rango = R = 2500-1000= 1500 Soles 

Nos Indica que 1500 nuevos soles es la distancia entre la venta menor 
y la mayor; el rango es una medida de dispersión de primera vista para 
la variabilidad de los datos; pero no evalúa el grado de variabilidad de 
los datos Intermedios. 

NOTA: 

SI todos los datos fuesen ¡guales el rango es cero, nos Indica que todos 
los datos se concentran en un mismo punto. SI el rango es diferente de 
cero nos Indica que los datos no se concentran en un mismo punto; es 
decir existe variabilidad o dispersión de los datos 

El rango puede ser positivo, negativo o cero 

El rango posee unidad de medida, que es la misma de los datos 

originales. 

El rango es bien sensible a la presencia de datos extremos (datos muy 
altos o datos muy bajo de lo normal) 

4.2. LA VARIANCIA O VARIANZA 

Su valor corresponde al promedio de las desviaciones al cuadrado de 
los datos con respecto a la media aritmética. Es decir su valor da una 
¡dea del grado de variabilidad de los datos con respecto a la media 
aritmética. La varlancla para un conjunto de datos esta expresada en 
unidades cuadráticas. Por ejemplo, si la unidad de medida de los datos 
es kilogramos, la varlancla será expresada en kilogramos al cuadrado. 
Este hecho dificulta la interpretación de la varlancla. 
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CÁLCULO DE LA VAR1ANCIA PARA LA POBLACIÓN PARA 

DATOS SIN AGRUPAR Y DATOS AGRUPADOS 


Sea X una variable en estudio que toma los valores x l , x 2 x N , y 
H su media aritmética poblacional, la variancla poblaclonal se 

simboliza por cr 2 y es definida por: 

PARA DATOS SIN AGRUPAR 


o 1 — 


^x 2 -NjU 


N 


N 


PARA DATOS AGRUPADOS 


o 2 — 


K. IV 

S<- ■ í-NjU 2 


N 


N 


• CALCULO DE LA VARIANCIA PARA UNA MUESTRA PARA 

DATOS SIN AGRUPAR Y AGRUPADOS 

PARA DATOS SIN AGRUPAR 

Sea X una variable en estudio que toma los valores jq , x 2 x n , y 

x su media aritmética muestral, la variancla para la muestra se 
simboliza por S 2 y es definida por: 


■ 2 ,-=l 


±x 2 -nX ¿ 


Z*) 2 


• 2 /-I 


* n —1 n —1 

PARA DATOS AGRUPADOS: 


n— 1 


(Z * jp 2 


YlXr X ff , Zc X) 2 f, Z 

S 2 _ 7 =1 __ 1 = 1 __ j= 1 _ 


n — 1 


n —1 


n —1 
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NOTA-1 


Si los datos fuesen todos iguales la variancia es cero, esto nos Indica 
que todos los datos están concentrados en la media aritmética, en 
otras palabras no existe variabilidad de los datos con respecto a la 
media aritmética. 

SI los datos son diferentes, de acuerdo a la definición el valor de la 
variancia será mayor que cero, en otras palabras existe variabilidad 
entre los datos con respecto a la media aritmética. 

NOTA-2 


Es riesgoso usar el valor de la variancia para concluir que los datos de 
la muestra son muy o poco variable. Su uso es más que todo para 
comparar la variabilidad entre dos o más conjuntos de datos que tienen 
media aritmética similares. 

Eiemplo-1 

Sea una muestra aleatoria de los pesos kg de 15 alumnos de un 
salón de clases, Hallar la variancia. 

35.5 37.5 38.0 38.0 39.0 37.0 36.8 35.8 36.0 35.0 35.0 

36.5 38.5 38.0 38.0 


De los datos, calculamos: 

í>,= 554.6 

i=l 

15 


20528- 88- (554.6) 2 

-=1.67638 

15-1 14 

5 2 = 1.67638^ 2 

1.67638 Kg 2 , este valor nos Indica la presencia de variabilidad de los 
pesos de los alumnos con respecto al peso promedio. 


X A 2 = 20528.88 


1=1 


15 


15 


F' 


i=i 

1 5 
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Ejemplo-2 


i 

pesos ( kg) 

fi 

h, 

Fi 


i 

X 

l 

1 


1.4-1.8) 

2 

5.88% 

2 

5.88% 

1.60 

2 


\l.S-2.2) 

4 

11.76% 

6 

17.64% 

2.0 

3 


2.2 - 2.6) 

4 

11.76% 

10 

29.40% 

2.4 

4 


1.6 -3.0) 

5 

14.71% 

15 

44.11% 

2.8 

5 


3.0-3.4) 

10 

29.42% 

25 

73.53% 

3.2 

6 


3.4-3.8) 

7 

20.59% 

32 

94.12% 

3.6 

7 


3.8-4.2) 

2 

5.88% 

34 

100% 

4.0 

TOTAL 

34 

100.0% 





Calcular el valor de la varlancla 


n = 34 

15 


=308.48 

1=1 

15 

100 

i=\ 

(2,*p 2 

34-1 


.48- (100) 2 
-=0.43522 


33 


0.43522 Kg 2 , es el resultado del promedio de las desviaciones al 
cuadrado; este valor nos Indica la presencia de variabilidad de 
pesos de los recién nacidos con respecto a su peso promedio 
Kg 2 . 


los 

en 
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• PROPIEDADES DE LA VAR1ANCIA 

1. Si los datos de la muestra son ¡guales; es decir los valores que 
toma los datos es constante; entones su varlancia o variabilidad 
es igual a nula (cero); es decir: 

x¡ = x 2 = ... = x¡ = ... = x n = m —» X = m —> 5 2 = 0 

2. Cuando a todos los datos de la muestra, se le multiplica por una 
constante "a" y además se le suma o resta otra constante "b", 
entonces la varlancia de los datos transformados, es igual a la 
primera constante al cuadrado multiplicado por la varlancia de 
los datos originales. 

x x , x 2 ,.., x¡ ...,x n —> X —sea la transformación 

y,= ax¡± b , luego se cumple que la varlancia de los datos 
transformados es igual a: 

S 2 = a 2 S 2 

y x 

4.3. DESVIACIÓN ESTANDAR 

Su valor, se define como la raíz cuadrada positiva de la varlancia; es 
decir, 


S x - JVarlancia 

El valor de la desviación estándar para un conjunto de datos esta 
expresado en las mismas unidades de la variable en estudio. Su valor 
es mayor o igual a cero, un valor cero Indica que los datos de la 
muestra esta concentrados en un mismo punto ( no hay variabilidad o 
dispersión), un valor mayor a cero indica la presencia de variabilidad o 
dispersión de los datos con respecto a la media aritmética. 

Ejemplo: 

De los ejemplos anteriores se tiene: 

Para datos sin agrupar: 

S x = yl.67638 kg 2 = 1.29475 Kg 
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Como la media aritmética de los datos es 36.97 kg., y la desviación 
estándar 1.29 kg. Valor que indica la presencia variabilidad o 
dispersión de los datos con respecto a la media aritmética. 

Para datos agrupados: 


S x = 0,(3522^’ = 0.65971 Kg 

Interpretación 

1.29475 Kg , es la desviación promedio con respecto a la media 
aritmética. 

0.65971 Kg , es la desviación promedio con respecto a la media 
aritmética. 

Ambos valores obtenidos nos indica la presencia de variabilidad de los 
datos con respecto a la media. 

NOTA-1 


La desviación estándar al igual que la variancia, se utiliza para 
comparar la variabilidad o el grado de dispersión de dos o más 
conjunto de datos que poseen la misma unidad de medida y tienen sus 
promedios similares; es decir si se tiene dos a más conjunto de datos 
que poseen la misma unidad de medida y promedio similares, tendrá 
mayor dispersión o mayor variabilidad con respecto a la media 
aritmética aquel conjunto de datos que tiene la mayor variancia o 
desviación estándar. 

Ejemplo 

De la tabla que conjunto de datos son mas variables o están mas 
dispersos 


Muestras 

Datos 

Media 

Aritmética 

Variancia 

Desviación 

estándar 

1 

4, 5, 6 

5 

1 

1 

2 

1,5, 9 

5 

16 

4 


Los datos de la muestra 2 están mas dispersos que la muestra 1 
4.4. COEFICIENTE DE VARIACIÓN 

Es una medida de variación relativa no tiene unidad de medida se 
calcula haciendo uso de la siguiente formula: 
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cv= =xl00% 

X 

El valor de coeficiente de variación CV , indica el número de veces 
que la desviación estándar contiene a la media aritmética, cuando 
contiene más veces a la media indica que los datos son más variables. 
Su valor se usa para comparar la variabilidad o dispersión entre dos o 
más conjuntos de datos que poseen diferentes unidades de medidas y 
medias aritméticas diferentes. 

Sean A y B dos conjuntos de datos si el coeficiente de variación para el 
conjunto A es mayor al coeficiente de variación para B, entonces los 
datos de A presentan mayor variabilidad o dispersión relativa que los 
datos de B. 

Ejemplo-1 

Sean los siguientes datos: 

1, 2, 3, 4, 5 

Hallar e interprete el coeficiente de variación 
x = 3 
5 2 = 2.5 
5= 1.5811 

1 5877 

CV = '_xl00% = 52.70% (Nos indica que la desviación 

3 

estándar para este conjunto de datos representa el 52.70% de 
su media aritmética) 

Eiemplo-2 


La siguiente información corresponden a los montos (SI.) por ventas 
de dos tiendas comerciales A y B. 


Valores estadísticos 

Tienda Comercial A 

Tienda Comercial B 

Venta promedio 

22,000 

18,500 

Desviación estándar 

2640 

3145 


¿Qué montos por ventas están más dispersos? 
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Para la tienda Comercial A 

CV= = 12.0% 

22000 

Para la tienda Comercial B 
3145 

cv= _*100% = 17.0% 

18500 


Por lo tanto los montos por ventas de la tienda comercial B son más 
variables o más dispersos que los montos por ventas de A. 

Aplicando el SPSS para datos no agrupados Media, Rango, Varlanza, 
Desviación estándar, 


Definiendo las variables 


ti 'Sin fchilol [ConjuntoDaUnOI - IBM SPSS SUtehu Editor de datos - O 

Aromo Eddar Yer Qatos Iranslormar balizar Gráteos UtilidaOes «me* anonas Ventana Ajyda 


a H A DC 

sr "a 

JSSaSP n as ^ oH 


Nombre 

Tipo 

Anchura Decimales 

Etiqueta 

Valores Perdidos Columnas Alineación Meada Rol 



Numérico 

S 1 

’eso recwn na 

-linguna Ninguna 8 9 Derecha f Escala \ Entrada 










































21 





22 









27 





























-m - 

Vista de variables 



IBM SPSS Statistics Processot está esto Unicode ON 


I P Escribe aquí para buscar 


7 
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Ingresando los datos 



Calculando el Rango, la Varianza, la Desviación estándar, 


En el Menú del SPSS escoger ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS-pasar la variable Peso_recien_nacido a la casilla de 
la derecha-OPCIONES- Desviación estándar; Varianza, Rango- 
CONTINUAR-ACEPTAR 
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Estadísticos descriptivos 



N 

Rango 

Desv. 

Desviación 

Varlanza 

Peso recien nacido 

34 

2,6 

,6600 

,436 

N válido (por lista) 

34 




Aplicando el SPSS para datos agrupados: Rango, Varlanza, Desviación 


estándar, con datos ya ingresados; en el menú del SPSS escoger: 

Para datos agrupados 

Se elabora la tabla de frecuencias para datos agrupados: 

7. Cálculo del Rango” R 

R = peso mayor -peso menor. 

R = 4.1-1.5 = 2.6 

8. Cálculo del número de clases (K). 

K= 1 + 3.3Log(34) = 6.05388 

Como el valor que toma K debe ser un número entero, usar el 
redondeo simple (redondeo por defecto), se tiene que K = 6. 

OBSERVACIÓN 

El redondeo simple significa, que si un número tiene como 
primer decimal un número mayor o igual a 5, entonces la cifra 
entera del número se Incrementa en una unidad. 

Ejemplo: 

Si, K = 6.7, usando el redondeo simple K = 7; 

Si, K = 6.4, usando el redondeo simple K = 6; 

9. Cálculo del ancho del intervalo de clase (A) 

El ancho del Intervalo de clase se obtiene a través de la siguiente 
fórmula: 



K 


Para los datos se tiene: 

A= R L = 2 J 6 _= 0.43333 
K 6 
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El valor que toma “A”, debe tener el mismo número de decimales 
de los datos originales. Por redondeo simple se tiene: 

A =0.4 


E = AK - R = 0.4(6) - 2.6 = -0.2 


Como el error es negativo, se debe Incrementar en una clase 
más(k=7) 

A =^=0.4 


7 


E = AK - R = 0 . 4 ( 7 ) - 2.6 = 0.2 


Cuando el error es positivo, la tabla tendrá 7 clases y ancho 0.4 

. , , E 0.2 

valor de arranque= dato menor - _= 1.5 - _= 1.4 

2 2 


En el menú del SPSS, escoger la opción TRANSFORMAR- 
RECODIFICAR EN DISTINTAS VARIABLES-pasar la variable peso- 
reclén-nacldo al casillero de la derecha, en la derecha en donde Indica 
variable de salida Nombre: poner peso_reclen_nacldo1 y en la etiqueta: 
poner Peso_reclen_nacldo1 - PRESIONAL LA OPCION CAMBIAR- 
VALORES ANTIGUOS Y NUEVOS-RANGO-poner desde 1,4 hasta 1,8, 
luego en VALOR poner 1 y AÑADIR, así sucesivamente continua con 
todos los rangos de 3,8 hasta 4,2. 
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Dalos Iranslormar ¿naluar 


g m-al» h aa js .»[ ♦ 

Nombra Tipo Anchura Dacimalas Euquosa Valoras Perdidos Columnas Abnaaoon I. 

1 Peso_racian_nacldo Numanco B 1 Poso ración na Mingiaia Ninguna S M Daracha f Es< 

I 2 


O Rango LOsVESr i 


• valor f? 



O Coctar saleras antiguos 


lefia* A 




Iconanuail Cancalar j Amos 


□ 


I P Escribe aguí para buscar 


)M SPSS S>a»sa.cs Procosaor esta lisio _ UnlcodaON 


J * • 


Cuando se termine de ingresar los rangos presionar, continuar y 
aceptar. 

Y se crea una variable Peso recien nacido 1. 


Q 'Sin Mulo i [CorauntoOotorO) - IBM SPSS Sulntics Ei 



I P Escribe aquí para buscar 


° 

□ 

■ 

Q « W ' S ^ 

□ E3TO! 

- u « v o ■» 'SÜZ et 
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En la variable Peso_reclen_nacldo_1, presionar la opción valores e 
Ingresar: 


es jgfead 11 « n a *i 



Y Poner aceptar. 

En el Menú del SPSS escoger la opción ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS-FRECUENCIA-para la variable Peso_reclen_nacldo 1 
al casillero derecho-ACEPTAR, y nos muestra los resultados 
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Calculando el Rango, la Varlanza, la Desviación estándar 

En el Menú del SPSS escoger ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS- -pasar la variable Peso_reclen_nacldo1 a la casilla 
de la derecha-OPCIONES-EI Rango, La Varlanza, la Desviación 
estándar-CONTINUAR-ACEPTAR 


Alchno Editai v«i Dalo» Iranafotmai Anallüí GrMcoi utilidades A-npliaaones ventana «tuda 

HÍ3.5 oH 



Víate de datos 


M SPSS Sladsacs PtoceBsof ceta lis 


I P Escribe aquí para buscar 


IH'Sfi 


Estadísticos descriptivos 


N 

Rango 

Desv. 

Desviación 

Varlanza 

Peso reden nacldol 

34 

6,00 

1,62889 

2,653 

N válido (por lista) 

34 





4.5. EJERCICIOS PROPUESTOS 

1. Los siguientes datos corresponden a estaturas (mts) de los 
alumnos de cierta universidad. 
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1.71 

1.68 

1.85 

1.58 

1.68 

1.66 

1.72 

1.67 

1.68 

1.65 

1.68 

1.65 

1.68 

1.67 

1.70 

1.70 

1.68 

1.65 

1.66 

1.68 



Hallar e interprete las medidas de dispersión absoluta y relativa 


2. Los siguientes datos, corresponden a una muestra al azar de 40 
frascos conteniendo mermelada de piña, los pesos (grs) se 
presentan a continuación: 


149 

164 

171 

176 

181 

185 

187 

190 

156 

165 

172 

176 

182 

186 

187 

194 

157 

165 

174 

178 

183 

186 

188 

196 

158 

168 

175 

180 

183 

188 

188 

198 

162 

170 

175 

180 

184 

187 

189 

202 


a. Elaborar la tabla de distribución de frecuencias. 

b. Calcular las medidas de dispersión o variabilidad. 

3. Se eligen al azar a 70 trabajadores de una empresa, la 
distribución de los ingresos mensuales se presentan en la tabla 
siguiente. 


i 

Ingresos 

fi 

1 

[400 600) 

6 

2 

[600 800) 

12 

3 

[800 1000) 

18 

4 

[1000 1200) 

15 

5 

[1200 1400) 

12 

6 

[1400 1600) 

7 


TOTAL 

70 


Usando la información de la tabla, calcular: 

a. El Rango 

b. Lavariancia 

c. La desviación estándar. 

d. El coeficiente de variación 

e. la variancia y desviación estándar. 
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f. La variancia y desviación estándar, si la empresa decide 
aumentar los ingresos de sus trabajadores en un 7% más 
45 nuevos soles. 

4. Una agencia bancada, con la finalidad de reducir el tiempo en la 
atención a los clientes, elige una muestra aleatoria de 60 clientes 
en un día determinado y registra el tiempo (minutos) que demora 
en ser atendido, estos resultados se presentan en la tabla. 


i 

Tiempos 

h¡ 

1 

[0.5 1.0) 

0.1 

2 

[l.O 1.5) 

a 

3 

[1.5 2.0) 

0.3 

4 

[2.0 2.5) 

b 

5 

[2.5 3.0) 

0.15 


TOTAL 

1 


a. Calcular el valor de “a” y “b”, si se sabe que el tiempo 

promedio de atención a un cliente es de 1.825. 

b. Calcular la desviación estándar. 

c. Calcular el coeficiente de variación. 

6. Los siguientes datos muestran los montos por ventas, en miles 

de dólares, de 20 vendedores de una compañía de computadora. 

40.2 29.3 35.6 88.2 42.9 26.9 28.7 99.8 35.6 37.8 

44.2 32.3 55.2 50.6 25.4 31.7 36.8 45.2 25.1 39.7 

a. Calcular la variancia, desviación estándar y coeficiente de 
variación. 

b. SI las ventas se Incrementan en un 15% con respecto a 
los montos Iniciales. Calcular el rango, la variancia, 
desviación estándar y coeficiente de variación. 

c. Elaborar la tabla de distribución de frecuencias. Calcular: 
rango, variancia, desviación estándar y coeficiente de 
variación. 
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7. Una muestra aleatoria de tamaño 20 tiene por media 5 y 

variancia igual a 0.36, sean las siguientes transformaciones: 

a. Si a cada dato se le incrementa en un 20% de su valor 
más 0.5 unidades. 

b. Si a cada dato se le incrementa en 25% de su valor más 
0.2 unidades. 

¿Que conjunto de los nuevos datos presenta la mayor variación? 

Ejercicios adicionales 
1. Sea la Tabla de datos: 


i 

X 

Y 

z 

1 

2 

i 

1 

2 

1 

i 

1 

3 

1 

2 

3 

4 

3 

2 

1 

5 

1 

2 

1 


Hallar el valor de: 

5 

£(*,■ + %)0 ; + z/)(y,- + z,-) 

a. Í=1 

2> 2 +y 2 +z 2 +xy + xz + yz ) 2 

1 2 3 i i i i i i 

b. '=' 

2. Sea la tabla de datos 


i 


fi 

1 

10 

2 

2 

11 

4 

3 

12 

6 

4 

13 

4 

5 

14 

2 


TOTAL 

18 


Hallar el valor de: 


Tj(x¡-x) 2 f 

i 


siendo x = i=1 5 - 
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3. Una muestra tomada al azar de 100 estudiantes que concurren a 
la Biblioteca Central de la Universidad Nacional Mayor de San 
Marcos, arroja que: el 70% son varones; la edad promedio es de 
28.4 años; el 15% pertenecen a la Escuela Académico 
Profesional de Blbllotecología; el 70% opinan que los servicios 
que presta la biblioteca es bueno; el gasto promedio mensual es 
de S/.450.00. Con la Información, establecer la población en 
estudio, la unidad elemental, tamaño de la muestra, variables, 
tipos de variables, parámetros y valores estadísticos. 

4. Una muestra aleatoria de 84 datos, arroja que el dato menor es 
17.1 y el dato mayor 37.2. Determinar los Intervalos de clases 
para la tabla de distribución de frecuencias. 

5. Sea la tabla de distribución de frecuencias 


Edades(años) 

fi 

h¡ 

Fi 


x\ 

1 

[ 20 > 



4 


18 

[ 



12 



[ 



28 



[ 



36 



[ 



40 



Total 







Completar la tabla 


6. Sea la tabla de distribución de frecuencias, cuya variable en 
estudios es la edad (años) de usuarios, que concurren a un 
centro de Información. 


Edades(años) 

fi 

K 

F i 


X. 

1 

[20 

24 > 

4 





[24 

28 > 

6 





[28 

32 > 

15 





[32 

36 > 

15 





[36 

40 > 

6 





[40 

44 > 

4 





Total 

50 






145 




























EsTADÍSTICa DESCRiptiva V pRoBABILIDAd pARa LAS CIENCIAS DE LA INFORMAciÓn CON El USO DEl SPSS 


a. Calcular e interpretar h¡ , H 5 — H 2 

b. ¿Qué cantidad de usuarios tienen edades superior a los 26 
años?. 

c. ¿Que % de usuarios tienen edades entre los 26 y 38 años. 

7. Una encuesta realizada a 20 jefes de hogar arroja los siguientes 
datos. 

1 3 2 4 2 0 1 2 

3 3 2 0 1 1 2 4 

2 2 12 

Elaborar la tabla de distribución de frecuencias y GRÁFICO 
respectivo. 

8. Una muestra aleatoria de 90 datos, arroja que el dato menor es 
20.45 y el dato mayor 70.35. Determinar los Intervalos de clases 
para la tabla de distribución de frecuencias. 

9. Sea la tabla de distribución de frecuencias 


Edades(años) 

fi 

h¡ 

Fi 

H, 

X. 

1 

[7 

> 


0.1 



10 

[ 

> 

8 





[ 

> 


0.4 




[ 

> 


0.2 




[ 

> 

4 





Total 







Completar la tabla 


10. Sea la tabla de distribución de frecuencias, cuya variable en 
estudios es la edad (años) de usuarios, que concurren a un 
centro de Información. 


Edades(años) 

fi 

K 

Fi 

Hi 

X. 

1 

[20 

24 > 

4 





[24 

28 > 

6 





[28 

32 > 

15 





[32 

36 > 

15 





[36 

40 > 

6 





[40 

44 > 

4 





Total 

50 
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a. Calcular e interpretar hs, H 2 

b. ¿Qué cantidad de usuarios tienen edades inferiores a los 30 
años?. 

c. ¿Que % de usuarios tienen edades entre los 22 y 42 años. 

11. Una encuesta realizada a 20 jefes de hogar arroja los siguientes 
datos. 

1 3 2 4 2 0 1 2 

3 3 2 0 3 1 2 4 

2 2 12 

Elaborar la tabla de distribución de frecuencias y GRÁFICO 
respectivo. 

12. La media aritmética de 20 datos es 4.5, si a cada dato se 
incrementa en su 20% más 3 unidades. Calcular su nueva media 
aritmética. 

13. El peso menor y mayor de 80 datos son 58.2 kg y 83.2 kg 
respectivamente: Determinar las clases para la tabla de 
distribución de frecuencias. 

14. Los siguientes datos corresponden a una encuesta tomada a 30 
jefes de familias, en la cual la variable en estudios es el número 
de hijos por familia. 

2412321224 
5334332234 
4334433335 
Calcular la media aritmética del número de hijos por familia. 

15. Distribución de las edades (años) de estudiantes de la UNMSM: 


Edades 

f 

K 

Fi 


x'. 

l 

18-22 

10 





22-26 


0.1875 




26-30 

30 





30-34 

15 





34-38 


0.1250 




TOTAL 
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a. Completar la tabla de distribución de frecuencias 

b. Que % de estudiantes tienen edades entre los 20 y 32 años. 

c. Calcular la media aritmética de las edades. 

16. La media aritmética de 20 datos es 4.5, si a cada dato se 
incrementa en su 20% más 3 unidades. Calcular su nueva media 
aritmética. 

17. Los siguientes datos corresponden a una encuesta tomada a 30 
jefes de familias, en la cual la variable en estudios es el número 
de hijos por familia. 

2412321224 

5334332234 

4334433335 

Calcular la media aritmética, la mediana y la moda del número 
de hijos. 

18. Distribución de las edades (años) de estudiantes de la UNMSM: 


Edades 

f 

h, 

F¡ 

H, 

x'. 

l 

18-22 


0.1250 




22 - 26 


0.1875 




26 - 30 


0.3750 




30 - 34 


0.1875 




34-38 


0.1250 




TOTAL 


1.0000 





Calcular la media aritmética, la mediana y moda de las edades 
de los estudiantes. 


19. Un estudiante del curso de estadística, calcula la media 
aritmética de 20 datos obteniendo como resultado 50; otro 
estudiante con los mismos datos obtiene por media aritmética 
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48, si el primer estudiante se equivoco al ingresar a la 
calculadora solo el último dato. Además la suma del dato errado 
y su verdadero es 100. Calcular el valor del dato verdadero. 

20. La mediana de un conjunto de datos par es 35, si cada dato se 
Incrementa en 15% más tres unidades, hallar el valor de la nueva 
mediana. 

21. Los siguientes datos corresponden al número de artículos de una 
muestra elegidas al azar de 30 revistas científicas. 


12 

14 

11 

12 

13 

12 

11 

12 

12 

14 

15 

13 

13 

14 

13 

13 

12 

12 

13 

14 

14 

13 

13 

14 

14 

13 

13 

13 

13 

15 


Calcular la media aritmética, mediana y moda del número de 
artículos por revistas. 

22. Distribución de las edades (años) de estudiantes de la UNMSM: 


Edades(años) 

f, 

h, 

F, 

H, 

x\ 

1 

18-22 


0.10 




22 - 26 


0.45 




26 - 30 


0.30 




30 - 34 


0.11 




34-38 


0.04 




TOTAL 


1.00 





a. Calcular la media aritmética, mediana y moda de las edades de 


los estudiantes. 

b. Calcular el 4to. decil y 3er. cuartll. 

c. Que edades encierran al 70% central de los estudiantes. 
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23. Distribución de las edades de estudiantes: 


Edad(años) 

f 

h t 

F; 


X. 

l 

16-20 


0.05 




20-24 


0.25 




24-28 


0.40 




28-32 


0.25 




32-36 


0.05 




TOTAL 


1.00 





Calcular para los montos por ventas: 


a. Media aritmética 

b. Mediana 

c. Moda 

d. El tercer decil 

e. El primer cuartil 

f. El 82 avo percentil 

g. Calcular la curtosis, interpretación 

24. Los siguientes datos corresponden a una encuesta tomada a 30 
jefes de familias, en la cual la variable en estudios es el número 
de periódicos comprados durante una semana determinada. 

2412321224 

5334332234 

4334433335 

Elaborar la tabla de distribución de frecuencias y su GRÁFICO 
correspondiente para la variable en estudio. 
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25. Distribución de las edades (años) de estudiantes de la UNMSM: 


Edades 

f, 

h, 

F, 


X. 

1 


10 




22 



0.1875 

25 


26 





0.6875 



15 











TOTAL 

80 






a. Completar la tabla de distribución de frecuencias 


b. Calcular e interpretar/ 3 ’ H 2 

c. Que % de estudiantes tienen edades inferiores a los 30 años. 

26. La tabla contiene datos sobre la edad de usuarios que concurren 
a un centro de información: 


Edad (años) 

f, 

h, 

F, 

H, 

X. 

l 

18-22 


0.10 




22-26 


“a” 




26-30 


0.35 




30-34 


“b” 




34-38 


0.1 




Total 







Si la media aritmética es 28.2 años. 

Calcular, la mediana, la moda, el 4to decil, el tercer cuartll 
y el 82 percentll. 

27. La variancla de un conjunto de datos no agrupados es 20, si 
cada dato se incrementa en un 10%. Hallar el nuevo valor de la 
variancla. 
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28. La estatura menor y mayor de 60 personas son 1.62 metros y 
1.82 metros, determinar para la tabla de distribución de 
frecuencias. 


29. La tabla contiene datos sobre la edad de usuarios que concurren 
a un centro de Información: 


Edad (años) 

f, 

h, 

Fi 


x'. 

1 

20-24 


0.10 




24-28 


“a” 




28-32 


0.30 




32-36 


“b” 




36-40 


0.1 




Total 







Si la media aritmética es 30 años. 

Calcular, la mediana, la moda, el 6to decil, el primer cuartil 
y el 82 percentil de las edades. 

10 

30. La media aritmética y varlancia de 4 datos es 6 y ^ , 
respectivamente, una revisión de los datos, se encontró que en 
lugar de ingresar a la calculadora el valor 8 se ingreso por error 
el valor 4. Con esta Información, calcular la media aritmética y 
variancla corregidas. 


31. La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio el número de artículos de 80 revistas 
científicas sobre biología elegidas al azar. 


X=N°de artículos 
por revistas 

f, 

h, 

Fi 


x'. 

1 

21 

5 





17 

5 





19 

20 





18 

40 





20 

10 





Total 

80 
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Hallar: la media, mediana, moda, la variancia y el coeficiente de 
variación. 

32. De una muestra de 80 datos el mayor y menor son 56.25 y 
12.34. respectivamente. Determinar los intervalos de clases para 
la tabla de distribución de frecuencias. 

33. La media de 20 datos es 5; la media de 30 datos es 6: Hallar la 
media de los 50 datos. 

£(x + x) 2 =1000 

34. Sean 50 datos, tal que x = 2 , además ¡=i 
Hallar su coeficiente de variación. 

35. La tabla contiene datos sobre la edad de usuarios que concurren 
a un centro de información: 


Edad (años) 

f, 

h, 

Ft 

H, 

x\ 

1 



0.10 



22 


12 




26 



0.20 






0.50 





4 





Total 







a. Completar la tabla 

b. Hallar la media aritmética, mediana y moda 

c. Que porcentajes de usuarios tienen edades entre 22 y los 
30 años. 

d. Hallar la variancia y el coeficiente de variabilidad. 

36. La media aritmética de 20 datos es 5; la media aritmética de 30 
datos es 6: Hallar la media aritmética de los 50 datos. 

37. Sean 50 datos, tal que x=4 .además . Hallar su 

coeficiente de variación. 
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38. La tabla contiene datos sobre las edades de usuarios que 
concurren a un centro de Información: 


Edad (años) 

f 

h t 



x. 

l 



0.10 



22 


12 




26 



0.20 






0.50 





4 





Total 







a. Completar la tabla. 

b. Hallar la media aritmética, mediana y moda. 

c. Hallar la varlancla y el coeficiente de variabilidad. 

d. Hallar el coeficiente de asimétrica. Interpretar resultado 

39. La media aritmética de 20 datos es 5; la media aritmética de 30 
datos es 6. Hallar la media aritmética de los 50 datos. 

40. La mediana de 60 datos es 18. SI a cada dato se Incrementa en 
un 12% más 3 unidades. Hallar el nuevo valor de la mediana. 

41. Una muestra tomada al azar de 50 revistas científicas en 
biología, proporciona los siguientes datos con respecto al 
número de artículos por revistas. 


12 

12 

12 

12 

13 

13 

13 

13 

13 

13 

13 

13 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

15 

15 

15 

15 

15 

15 

15 

15 

16 

16 

16 

16 

16 

17 

17 

17 

17 

18 

18 

18 

18 

19 

19 


19 19 

Calcular: 


a. La media aritmética, la mediana, la moda del número de 
artículos por revistas. 

b. El tercer decil, el tercer cuartil y el ochenta y cinco avo 
percentll del número de artículos por revistas. 
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42. La tabla contiene datos sobre las edades de usuarios que 
concurren a un centro de Información: 


Edad (años) 

f 

h, 

F t 


x. 

l 

20-24 


0.10 




24-28 


0.20 




28-32 


0.46 




32-36 


0.16 




36-40 


0.08 




Total 


1.00 





a. Hallar la media aritmética, mediana y moda de las edades 
de los usuarios. 

b. Hallar la media aritmética de las edades de los usuarios 3 
años después. 

43. El menor de los pesos de 70 estudiantes de la UNMSM es 56.4 
kg y el peso mayor es de 94.3 kg. Determinar las clases, para la 
tabla de distribución de frecuencias. 

44. Una muestra tomada al azar de 50 revistas científicas en 
biología, proporciona los siguientes datos con respecto al 
número de artículos por revistas. 


12 

12 

12 

12 

12 

13 

13 

13 

13 

13 

13 

13 

13 

13 

13 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

15 

15 

15 

15 

15 

15 

15 

15 

15 

15 

16 

16 

16 


16 16 
Calcular: 

La media aritmética, la mediana, la moda, el cuarto decil, el 
primer cuartil y el setenta y dos avo percentll del número de 
artículos por revistas. 
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45. La tabla contiene datos sobre las edades de usuarios que 
concurren a un centro de Información: 


Edad (años) 

f, 

h, 

F, 

H, 

x. 

l 



0.10 



22 


20 







0.46 



30 


16 







0.08 




Total 


1.00 





a. Completar la tabla de distribución de frecuencias. 

b. Hallar la media aritmética, mediana y moda de las edades 
de los usuarios. 

c. ¿Qué porcentaje de usuarios tienen edades entre los 26 y 
34 años. 

5 

Y(xr-x).y, 

d. De la tabla calcular el valorde —- 

n — 1 


46. El menor de los pesos de 70 estudiantes de la UNMSM es 57.4 
kg y el peso mayor es de 93.3 kg. Determinar las clases, para la 
tabla de distribución de frecuencias. 

47. Una muestra tomada al azar de 50 revistas científicas en 
biología, proporciona los siguientes datos con respecto al 
número de artículos por revistas. 


12 

12 

12 

12 

12 

13 

13 

13 

13 

13 

13 

13 

13 

13 

13 

13 

13 

13 

13 

13 

13 

13 

13 

13 

13 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

15 

15 

15 

15 

15 

15 

15 

15 


16 16 
Calcular: 

La media aritmética, la mediana, la moda, el cuarto decil, el 
primer cuartil y el setenta y dos avo percentll del número de 
artículos por revistas. 
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48. La tabla contiene datos sobre las edades de usuarios que 
concurren a un centro de Información: 


Edad (años) 

í 

h, 


H, 

x. 

l 


22 > 


0.10 



20 



20 








0.30 






8 








0.04 




Total 


1.00 





a. Completar la tabla de distribución de frecuencias. 

b. Hallar la media aritmética, mediana y moda de las edades 
de los usuarios. 

c. ¿Qué porcentaje de usuarios tienen edades entre los 24 y 
32 años. 

5 

d. De la tabla calcular el valorde —- 

n —1 


49. La tabla contiene datos sobre las edades de usuarios que 
concurren a un centro de Información: 


Edad (años) 

fi 

h, 

F, 

H, 

x'. 

l 

18-22 


0.06 




22 - 26 


0.50 




26 - 30 


0.20 




30 - 34 


0.12 




34 - 38 


0.08 




38 - 42 


0.04 




TOTAL 


1.00 





Hallar: A, A¡> As 
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50. La tabla contiene datos sobre las edades de usuarios que 
concurren a un centro de Información: 


Edad (años) 

f, 

h, 

Ft 

H, 

x\ 

1 

20 - 24 

2 





24 - 28 

27 





28 - 32 

13 





32 - 36 

6 





36 - 40 

2 





TOTAL 







Hallar: R, S 2 , S, CV, D , Q , P 


2 3 72 


51. De dos bases de datos, se eligen en forma aleatoria 5 revistas 
científica, la variable en estudios es el número de artículos por 
revistas; los datos son: 

A ={7,2,13,3,4} , B = {11,12,11,13,11}, 

¿Cual presenta mayor variabilidad? 

52. La varlancla de 10 datos es 5, si a cada dato se le Incrementa en 
un 20% más 2 unidades. Hallar el nuevo valor de la varlancla. 


53. La tabla contiene datos sobre las edades de usuarios que 
concurren a un centro de Información: 


Edad (años) 

fi 

h, 



X. 

1 

18-22 


0.06 




22- 26 


0.52 




26- 30 


0.20 




30- 34 


0.10 




34- 38 


0.08 




38 - 42 


0.04 




TOTAL 


1.00 





Hallar: Ai» <2i> P¡n 
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54. La tabla contiene datos sobre las edades de usuarios que 
concurren a un centro de Información: 


Edad (años) 

f, 

h, 

F t 

H, 

x. 

l 

20- 24 

2 





24- 28 

6 





28- 32 

13 





32- 36 

28 





36 - 40 

1 





TOTAL 

50 






Hallar: R, S 2 , S, CV, D , Q , P 


3 1 78 


55. De dos bases de datos, se eligen en forma aleatoria 5 revistas 
científica, la variable en estudios es el número de artículos por 
revistas; los datos son: 

A= {11,12,11,13,11} , B = {7,2,13,3,4}, 

¿Cual presenta mayor variabilidad? 

56. La variancia de 10 datos es 5, si a cada dato se le incrementa en 
un 30% más 4 unidades. Hallar el nuevo valor de la variancia. 

(4PTOS) 

57. Sea la tabla de datos: X=grado de Instrucción del eje de familia; 
Y= número de hijos 


X 

Sup 

prlm 

prlm 

sec 

sec 

sup 

sec 

prlm 

Sup 

sup 

Y 

1 

3 

2 

2 

3 

2 

1 

1 

1 

3 


Elaborar la tabla de doble entrada 


10 

58. La media aritmética y variancia de 4 datos es 6 y ^ , 
respectivamente, una revisión de los datos, se encontró que en 
lugar de ingresar a la calculadora el valor 8 se Ingreso por error 
el valor 4. Con esta Información, calcular la media aritmética y 
variancia corregidas. 


159 



























EsTADÍSTICa DESCRiptiva V pRoBABILIDAd pARa LAS CIENCIAS DE LA INFORMAciÓn CON El USO DEl SPSS 


59. Una muestra tomada al azar de 50 revistas científicas en 
biología, proporciona los siguientes datos con respecto al 
número de artículos por revistas. 


12 

12 

12 

13 

13 

13 

13 

13 

13 

13 

13 

13 

13 

13 

13 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

14 

15 

15 

15 

15 

15 

15 

15 

15 

15 

15 

15 

15 

16 


16 16 
Calcular: 

La media aritmética, la mediana, la moda, el cuarto decil, el 
primer cuartil y el setenta y dos avo percentil del número de 
artículos por revistas. 

60. La tabla contiene datos sobre la edad de usuarios que concurren 
a un centro de Información: 


Edad 

(años) 

7 

h, 

Ft 

H, 

X. 

l 

18-22 


0.10 




22-26 


“a” 




26-30 


0.35 




30-34 


“b” 




34-38 


0.1 




Total 







SI la media aritmética es 28.2 años. 

Calcular, la mediana, la moda, el 3er. decil, el 1 er cuartil y 
el 87 avo percentil. 

61. La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio el número de artículos de 60 revistas 
científicas sobre biología elegidas al azar. 
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X=N°de artículos 
por revistas 

f 

h, 

Fi 

H, 

x'. 

1 

21 

5 





17 

5 





19 

30 





18 

10 





20 

10 





Total 

60 






Hallar: la media, mediana, moda, el 3er. decil, el 1er cuartil 
y el 87 avo percentll y el coeficiente de variación. 

62. De una muestra de 80 datos el mayor y menor son 56.26 y 
12.38. respectivamente. Determinar los Intervalos de clases para 
la tabla de distribución de frecuencias. 

63. Sean los datos: 

12 12 13 14 15 13 16 17 

15 18 19 17 

Hallar: \ a media, mediana, moda, el 3er. decil, el 1er cuartil y el 
87 avo percentll y el coeficiente de variación. 

^ (x —x) 2 = 14.7 

64. Sean 50 datos, tal que x = 2 , además ,=i 
Hallar su coeficiente de variación. 

65. La tabla contiene datos sobre la edad de usuarios que concurren 
a un centro de Información: 


Edad (años) 

f. 

h, 

Fi 

H, 

X. 

l 



0.10 



22 


12 




26 



0.20 






0.50 





4 





Total 
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a. Completar la tabla 

b. Hallar la media aritmética, mediana y moda 

c. Que porcentajes de usuarios tienen edades entre 22 y los 
30 años 

d. Hallar la varlancla y el coeficiente de variabilidad. 

66. Sean los conjuntos de datos: 

A = {4,12,8,7,10,8} 

£ = {3,13,9,8,10,11} 

Indicar que conjunto de datos presenta mayor variabilidad o 
dispersión. 


67. La tabla contiene datos sobre la edad de usuarios que concurren 
a un centro de Información: 


Edad (años) 

f, 

h, 

Fi 


x. 

l 

20-24 


0.10 




24-28 


“a” 




28-32 


0.30 




32-36 


“b” 




36-40 


0.10 




Total 







SI la media aritmética es 30 años. 

Calcular, la mediana, la moda, el 3er decil, el 1 er cuartil y 
el 85 avo percentll de las edades. 

10 

68. La media aritmética y varlancla de 4 datos es 6 y 3 , 
respectivamente, una revisión de los datos, se encontró que en 
lugar de Ingresar a la calculadora el valor 8 se Ingreso por error 
el valor 4. Con esta Información, calcular la media aritmética y 
varlancla corregidas. 
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69. La siguiente tabla de distribución de frecuencias, tiene con 
variable en estudio el número de artículos de 80 revistas 
científicas sobre biología elegidas al azar. 


X=N°de artículos 
por revistas 

f, 

K 

F, 


x'. 

l 

21 

5 





17 

5 





19 

20 





18 

40 





20 

10 





Total 

80 






Hallar: la media, mediana, moda, la variancia y el coeficiente de 
variación. 
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CAPÍTULO 5 

ANÁLISIS EXPLORATORIO DE DATOS 


INTRODUCCIÓN 

Esta técnica trata de la descripción de las características de la variable 
en estudio a través de sus datos, con el objetivo de conocer la 
dispersión, simetría o asimetría, ubicación de la mediana, así como la 
presencia de datos discordante (autlier). Para su análisis se presenta el 
diagrama de tallos y hojas, y el diagrama de cajas. 

5.1. GRÁFICO DE TALLOS Y HOJAS 

Esta técnica de análisis de datos, tiene el mismo propósito del 
histograma de frecuencias. Sin embargo una ventaja sobre el 
histograma es que conserva los datos en su forma original, ya que en la 
construcción del histograma de frecuencias, los datos originales ya no 
son considerados sino solo las frecuencias absolutas en las clases 
respectivas. Esta técnica de tallos y hojas proporciona Información 
respecto: a la Simetría o Asimetría de un conjunto de datos, su 
dispersión o concentración y la presencia o ausencia de datos 
extremos o anormales (datos muy bajos o muy altos de locomún). 

5.2. CONSTRUCCIÓN DEL GRÁFICO DE TALLOS Y HOJAS 

Los datos de la muestra se ordenan en forma ascendente, luego un 
dato se divide en dos partes, tallos y hojas; los primeros dígitos del dato 
como un tallo y el último digito como una hoja de dicho tallo, las hojas 
pueden tomar valores entre 0 y 9. Luego los valores del tallos se 
colocan de menor a mayor en forma vertical y sus valores 
correspondientes a las hojas, separados por un segmento de recta 
vertical, y en la parte Inferior del GRÁFICO de tallos y hojas se coloca 
la unidad que utiliza la hoja 

Ejemplos: descomponer los datos que a continuación se Indica en tallo 
y hojas y colocar la unidad de la hoja: 

42 —> 4/2 (El tallo es 4, de las decenas y la hoja 2 de la unidad) 

4.2 —> 4/5 (El tallo es 4 de la unidad y la hoja 2 de la décima) 

42.5 —> 42/ 5 (El tallo es 42 de la unidad y la hoja 5 de la décima) 
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42.35 —> 423/5(EI tallo es 423 de la décima y la hoja 5 de la 
centésima) 

0.42 —> 4 / 2 (El tallo es 4 de la décima y la hoja es 2 de la 
centésima) 

0.042—>4/ 2 (El tallo es 4 de la centésima y la hoja es 2 de la 
milésima) 

0 . 0042 —> 4 / 2 (El tallo es 4 de la milésima y la hoja es 2 de la diez 
milésima) 

Ejemplo: Sean los datos de pesos de recién nacidos (kg) 


1.5 

1.6 

1.9 

2.0 

2.1 

2.1 

2.3 

2.4 

2.5 

2.5 

2.6 

2.7 

2.8 

2.9 

3.0 

3.1 

3.1 

3.2 

3.2 

3.2 

3.2 

3.3 

3.3 

3.3 

3.4 

3.4 

3.5 

3.6 

3.6 

3.7 

3.7 

3.9 


4.1 4.1 

Elaborar el diagrama de tallos y hojas, comentarlos 


1 

2 

3 

4 


569 

01134556789 

011222233344566779 

11 


Siendo la unidad de hoja=0.1 (décima), el tallo es la unidad 


Interpretación de gráfico de tallos y hola 


En este caso la distribución de los datos es asimétrica a la Izquierda o 
asimetría negativa existe poca variabilidad y no hay datos extremos. 


En este caso los tallos lo conforman los primeros dígitos y las hojas 
los últimos dígitos. El uso del GRÁFICO de tallos y hojas es Igual al del 
hlstograma de frecuencias, la única diferencia esta en que del 
GRÁFICO de tallos y hojas se pueden recuperar los datos, lo cual se 
logra al juntar los tallos con su respectiva hoja y multiplicándolo por la 
unidad de la hoja. 

5.3. DIAGRAMA DE CAJA 


El diagrama de caja al Igual que el hlstograma de frecuencias y el 
gráfico de tallos y hojas, permite tener una ¡dea visual de la distribución 
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de los datos; es decir, si hay simetría, ver el grado de variabilidad 
existente y por ultimo identificar la presencia de datos extremos (datos 
anormales). El diagrama de de caja es útil para comparar grupos de 
datos, es una alternativa Gráfica a la prueba de t-Student ( si se 
compara dos grupos de datos) o a la prueba de F-Snedecor del análisis 
de variancia, si se compara mas de dos grupos de datos, lo anterior es 
posible debido a que se pueden hacer múltiples diagramas de cajas en 
una misma Gráfica, en cambio los diagramas de tallos y hojas salen en 
secuencia uno por paginas, esto es usando los paquetes estadísticos 
MINITAB o SPSS. 

Características de diagrama de caja 


ql q2=me q3 

1. La línea central de la caja representa el valor de la mediana 
(q2=me) 

2. Los lados de la caja representa el 1er. Cuartel (ql) y tercer 
cuartel (q3). 

3. Si el valor de la mediana se encuentra en el centro, entonces los 
datos se distribuyen simétricamente. 

4. Si el valor de la mediana tiende a ql, existe asimétrica hacia la 
derecha (asimetría positiva), si el valor de la mediana tiende a 
q3, existe asimétrica hacia la izquierda ( asimetría negativa) 

5. Si la caja no es alargada, nos indica que no hay mucha 
variabilidad en los datos. 

6. Si no hay datos extremos o anormales (datos muy altos o datos 
muy bajos de lo normal) , las líneas laterales de la caja llegan 
hasta el dato menor y el dato mayor. 

7. Si hay datos extremos estos aparecen identificados en el gráfico 
y las líneas laterales llegan hasta los valores adyacentes a las 
fronteras interiores. 

8. Las fronteras interiores se calculan por 

G, - 1.5 RIQ y Q x + Í.5RIQ, respectivamente, siendo 
RIQ = <2 3 - <2j el rango intercuartilico, las fronteras exteriores 
se calcula por Q x - 3RIQ y Q¡ + 3 RIQ . 
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9. Si un dato cae fuera de Q x - 3 RIQ y Q x + 3 RIQ , se dice 

que es un dato extremo, en caso contrario es un dato extremo 
moderado. Un dato extremo se representa por "0" y un dato 
moderado por " x" 

Ejemplos 

Sean los datos de tres variables 
X Y Z 


1 

1.2 

1.1 

1.0 

2 

1.3 

2.0 

1.1 

3 

2.0 

2.1 

2.0 

4 

2.0 

3.0 

2.0 

5 

2.0 

3.0 

2.1 

6 

2.0 

3.1 

3.0 

7 

2.1 

4.0 

3.0 

8 

2.1 

4.0 

3.1 

9 

3.0 

4.1 

3.1 

10 

3.0 

4.1 

3.1 

11 

3.1 

4.2 

3.2 

12 

3.1 

4.2 

4.0 

13 

4.0 

4.2 

4.0 

14 

4.1 

5.0 

4.1 

15 

5.0 

5.0 

5.0 

16 


5.1 

5.1 

17 


5.1 



Representar los datos de las columnas en gráficos de tallos y hojas 
Para la primera variable 


2 

( 6 ) 

7 

3 

1 


1 23 

2 000011 

3 0011 

4 01 
50 


Unidad de hoja=0.1 
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Para la Segunda columna: 


1 

3 
6 

(7) 

4 


1 1 

2 01 

3 001 

4 0011222 

5 0011 


Unidad de hoja =0.1 


Para la tercera columna: 


2 

5 

( 6 ) 

5 

2 


1 01 
2 001 

3 001112 

4 001 

5 01 


Unidad de hoja=0.1 


Calcular de la media, mediana, desviación estándar para las tres 
columnas, usando las formulas ya conocidas: 


Columnas 

Numero de 
datos 

media 

mediana 

Desviación 

estándar 

1 

15 

2.667 

2.1 

1.079 

2 

17 

3.724 

4.1 

1.175 

3 

16 

3.056 

3.1 

1.213 


5.4. OTRAS MEDIDAS DE POSICIÓN 
• PERCENTILES PARA DATOS SIN AGRUPAR 


Son valores que divide al conjunto de datos ordenados ascendente o 
descendente en 100 partes ¡guales, la formula para calcular los 
percentlles es: 

P r X j = X i + a(X M -X ¡ ) (a) 

(n+ 1) 

100 

7 = 1,2, 3,4,...,99 
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Siendo: 


P¡ = Valor que divide a un conjunto de “n” datos ordenados, de tal 
forma que el j% de los datos son menores o iguales que el valor del 
percentil P¡ y (100 -j)% de los datos son mayores al valor de 
percentil P } 


Xi = Valor del dato en la posición del entero del número (n + 1 yi- 


100 


“a” =declmal del numero , +1) i 

100 


CUARTILES 


< 2 , 


PARA DATOS SIN AGRUPAR 


Son valores que divide al conjunto de datos ordenados ascendente o 
descendente en 4 partes iguales, en la formula es: 


Q,= x j = X i +a(X M -X ¡ ) 7=1,2, 3 

(»+D- 

• PECHES PARA DATOS SIN AGRUPAR 

Son valores que divide al conjunto de datos ordenados ascendente o 
descendente en 10 partes iguales, en la formula ( CL ),J toma los 
siguientes valores: 


D J = X wL =X i+ a(X ¡+l -X i ) 
10 


7= 1, 2, 3,4,5,6,7,8,9 


Ejemplo: 


La variable peso (kg) de los recién nacidos 


1 

2 

3 

4 


569 

01134556789 

011222233344566779 

11 


Siendo la unidad de hoja=0.1 n=34 
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Calcular: 

Los cuartlles, el tercer decil y el percentll 72 avo, el rango 
intercuartilico, media, moda, desviación estándar 

Utilizado las formula correspondiente, se tiene: 

2i = X 0.25*35=^8.75 = x 8 + 0.75(x 9 -x 8 ) = 2.4 + 0.75(2.5-2.4) = 2.475 
Q 2 = X 050*35 = X 115 = x 17 + 0.5(x 18 - x 17 ) = 3.1+ 0.5(3.2 - 3.1) = 3.150 
<2 3 -X 075 t 35 -X 26.25 -x 2( ,+ 0.25(x 27 -x 26 ) = 3.4 + 0.25(3.5 - 3.4 =3.425 

Tercer cuartil 

^ 3 = ^ 0 . 3 * 35 = ^ 10 . 5 = x io + 0.5(x n - x 10 ) = 2.5 + 0.5(2.6 - 2.5) = 2.55 

Setenta y dos percentll 

P 12 — X 0 . 72*35 = X 25 . 2 = t 25 + 0.2(x 26 — x 25 ) = 3.4 + 0.2(3.4 — 3.4) = 3.4 
RIQ = Qi - Qi = 3.425- 2.475 = 0.95 
x = 2.965 kg 

m= 3.2 kg 

s = 0.687 kg 

0.687 

cv — _*100% =23.17% 

2.965 

P 

• CALCULO DE PERCENTILES 7 PARA DATOS AGRUPADOS 

Para datos discretos 

Ejemplo 
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X=No de 
artículos por 
revistas 

fi 

Ft 


14 

10 

10 

Xj— » x 10 =14 

15 

15 

25 

x n — » x 25 = 15 

16 

20 

45 

x 25 — > x 45 = 16 

17 

18 

63 

*46^*63= 17 

18 

14 

77 

Xg 4 + x-]-¡ — 18 

19 

6 

83 

x 78 x 83 =19 

total 

83 




Calcular: Di, Qj, P 12 

D 7 =X &w _=X^ = X 5H +0.8(X 5g -X 5S )= 17 + 0.8(17-17) = 17 
10 

El 70 % de las revistas, tienen menor o Igual a 17 artículos, el 
30 % de las revistas tienen mayor a 17 artículos. 

Q 3 =X 3=X 63 = 17 

(83+1) 7 

4 

El 75 % de las revistas, tienen menor o Igual a 17 artículos, el 25 % de 
las revistas tienen mayor a 17 artículos. 

P 12 =x 72 = X 6Ü48 = ^ 60 + 0.48( X 6Í - X m ) = \1 + 0.48(17 -17) = 17 

(83+i) 

roo 

El 72 % de las revistas, tienen menor o Igual a 17 artículos, el 28 % de 
las revistas tienen mayor a 17 artículos 

Para datos continuos 

La formula es: 
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_nj. F¡i 

f = Ir + (^j-) * A 

i 

J= 1, 2, 3, 4,...,99 

Dónde: 

L¡ = Límite Inferior de la clase que contiene al valor del percentll 

Pj= Valor del percentll que acumular el j% de los datos de la 
muestra 

A = Ancho de clase 

Fí_\ = Frecuencia acumulada absoluta de la clase anterior a la clase 
que contiene al valor del percentll 

/i = Frecuencia absoluta de la clase que contiene al valor del 
percentil 

Nota: 

La primera frecuencia absoluta acumulada o frecuencia relativa 
acumulada que sea superior al valor 3L 0 i , será la clase que 

100 100 

contiene al valor del percentll p . 

Es decir: 


F¡> 


nj 

100 


o 


H¡> 


i 

100 


Para los Cuartiles será: 


_ F¡1 

Qj= Lf ( 4 - 

2 , 3 

La relación para ubicar en que clase se encuentra el valor del cuartil es: 
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Para los Deciles será: 


F >n¿ o H> J 
' 4 ' 4 


SL_f 

D = L + ( 10 _1)* A 

' ' f 

J -1,2, 3,4, 5,6,7, 8,9 

La relación para ubicar en que clase se encuentra el valor del decil es: 

j? > 4/ o H > 

1 “10 ' 10 

Ejemplo aplicativo 

La tabla de distribución de frecuencias contiene a las edades (años) de 
los usuarios que concurren a un centro de Información: Calcular el 1er 
cua rtil, 3er cuartil; 4to. decil y el 65avo percentil. _ 


Edades de usuarios 

f, 

F, 

18.5-22.5 

5 

5 

22.5-26.5 

9 

14 

26.5-30.5 

12 

26 

30.5-34.5 

20 

46 

34.5-38.5 

13 

59 

38.5-42.5 

10 

69 

42.5-47.5 

4 

73 

Total 

73 



Cálculo del 1er cuartil 

ni 73*1 

±='^_= 18.25 -+F >18.25^1 = 3 dase 
4 4 

n L- f 3 j 

Qi = L 3 + ( 4 -—) * A = 26.5 + ( 18 ~ 2544 ) * 4 = 27.92 años 

fi 12 
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El 25% de los usuarios tienen edades menores o ¡guales a 27.92 años, 
y el otro 75% de los usuarios tienen edades superior a los 27.92 años. 


CáJcuk^Cjjejj ^er cuartil 


nj 

4 


4 


F > 54.75 i =5 


clase 


2 = ¿ + ( 


n J _ f 54 75 _ 46 

5 ~ 1 )*A= 34.5 + ( ' ) * 4 = 37.19 años 

/, 13 


Interpretación 

El 75% de los usuarios tienen edades menores o ¡guales a 37.19 años 
y el otro 25% de los usuarios tienen edades superiores a 37.192 años. 

Cálculo del 4to. decil 


n í _ 73* 4 _ 292 ^ p > 29.2 ->i = 4 

10 10 


nj 

— — F 29 2 — 2fS 

D =L +(4_ü) * A = 30i l| * 4 = 31.14 años 


Á 


20 


Interpretación 


El 40% de los usuarios tienen edades menores o ¡guales a 31.14 años 
y el otro 60% de los usuarios tienen edades superiores a 31.14 años. 


Cálculo del 65 avo percentil 

■ F> 47.45 


nj = n = 47.45 


100 100 


5 


p = p + ( 100 5 1 ) * A = 34.5 + ( ^7-45 46) ^ ^ _ ^4 ^5 años 

65 5 A 13 

Interpretación 

El 65% de los usuarios tienen edades menores o ¡guales a 34.95 años 
y el otro 35% de los usuarios tienen edades superiores a 34.95 años. 
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5.5. OTRA MEDIDA DE VARIABILIDAD 
RANGO INTERCUARTIL 

El rango intercuartilico para un conjunto de datos, es la 
diferencia entre el tercer y el primer cuartil, y su valor expresa la 
variabilidad en el 50% central de los datos. 

Ríe = q 3 -Q x 

Ejemplo 

De la tabla anterior el rango Intercuartilico es: 

RIC = Q 3 — Qi = 37.19 — 27.92 = 9.27 Años es la variabilidad 
de las edades para el 50% central de los datos 

Aplicando el SPSS para realizar el gráfico de tallo y hojas y el diagrama 
de cajas 

Definiendo las variables 

^ 'Sin titulo 1 [ConjuntoDetosOI - IBM SPSS SUbxbcs Editor de datos — 0 X 

Archwo E«tar yei Dalos Iranslocmar ^alizar Gráteos Utilidades Ampliaciones Ventana Anida 

3H8 U r ti H Ha ■!&[* 
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Ingresando los datos 

«hito ' ICo^UMoOMOtOl - l#M Wtt t <1*t» de iUlot 

hicheeo fcflildi Ü»I pwo» Traneiorn». W» G»«lli 


□ 




«i - 

* 

« | -r » | | - 


- 

TI 

20 


— 






- 

22 

26 










20 

30 

> 








32 

r 







































D 

—— 

- 

.1.1 U.HBT 





En el Menú del SPSS escoger ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS—EXPLORAR-pasar la variable Peso_recien_nacido a 
la casilla de la derecha-GRÁFICO-marcar de tallo y -CONTINUAR- 
ACE PTAR 


Peso recién nacido Gráfico de tallo y hojas 
Frecuencia Stem & Hoja 


.00 

1 . 


3.00 

1 . 

569 

5.00 

2 . 

01134 

7.00 

2 . 

5566789 

12.00 

3 

011222233344 

6.00 

3 . 

566779 

1.00 

4 . 

1 

Ancho del tallo 

: 1.0 

Cada hoja: 


1 caso(s) 
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Cálculo de los percentlles con SPSS 
Definiendo las variables 



Ingresando los datos 


¿(Star ¥«r QaBos Iransformar ^alizar 


IH íMí 


'» h m*i cuí >s 


O 


I P Escribe aquí para buscar 
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Se elabora la tabla de frecuencias para datos agrupados: 

10. Cálculo del Rango” R 

R = peso mayor -peso menor. 

R = 4.1-1.5 = 2.6 

11. Cálculo del número de clases (K). 

K= 1 + 3.3Log(34) = 6.05388 

Como el valor que toma K debe ser un número entero, usar el 
redondeo simple (redondeo por defecto), se tiene que K = 6. 

OBSERVACIÓN 

El redondeo simple significa, que si un número tiene como 
primer decimal un número mayor o Igual a 5, entonces la cifra 
entera del número se Incrementa en una unidad. 

Ejemplo: 

SI, K = 6.7, usando el redondeo simple K = 7; 

SI, K = 6.4, usando el redondeo simple K = 6; 

12. Cálculo del ancho del intervalo de clase (A) 

El ancho del Intervalo de clase se obtiene a través de la siguiente 
fórmula: 



K 


Para los datos se tiene: 


A =ü_ = 2 A_ = 0.43333 
K 6 

El valor que toma “A”, debe tener el mismo número de decimales 
de los datos originales. Por redondeo simple se tiene: 

A =0.4 
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E = AK - R = 0.4(6) - 2.6 = -0.2 

Como el error es negativo, se debe incrementar en una clase 
más(k=7) 

A =22 = 0.4 
7 


E = AK- R = 0 . 4 ( 7 ) - 2.6 = 0.2 

Cuando el error es positivo, la tabla tendrá 7 clases y ancho 0.4 

E 0.2 

valor de arranque= dato menor - _= 1.5 — _= 1.4 

2 2 

En el menú del SPSS, escoger la opción TRANSFORMAR- 
RECODIFICAR EN DISTINTAS VARIABLES-pasar la variable peso- 
reclén-nacldo al casillero de la derecha, en la derecha en donde Indica 
variable de salida Nombre: poner peso_reclen_nacldo1 y en la etiqueta: 
poner Peso reden nacldol - PRESIONAL LA OPCION CAMBIAR- 
VALORES ANTIGUOS Y NUEVOS-RANGO-poner desde 1,4 hasta 1,8, 
luego en VALOR poner 1 y AÑADIR, así sucesivamente continua con 
todos los rangos de 3,8 hasta 4,2. 


a 
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Arenivo £«» iíi Qalos Iianstormai snaluai Giüücos LHiiidaiMs Ampliaciones ventana A/uOa 

'3§ H ift E33 «- -« J*1ir3lBi H 



Cuando se termine de ingresar los rangos presionar continuar y 
aceptar. 

Y se crea una variable Peso recien nacido 1. 





B M ■» a n 
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En la variable Peso_reclen_nacldo_1, presionar la opción valores e 
Ingresar: 


’ ni. G. - - f K 


♦I 



3 


Y Poner aceptar. 

En el Menú del SPSS escoger la opción ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS-FRECUENCIA-pasar la variable Peso reden nacido 1 
al casillero derecho-ESTADISTICOCO-seleccionar percentlles-en 
casillero de la derecha Indicar que percentll se quiere calcular y poner 
añadlr-CONTINUAR- ACEPTAR, y nos muestra los resultados 
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Estadísticos 

Peso recien nacidol 


N Válido 

34 

Perdidos 

0 

Percentlles 5 

1,0000 

15 

2,0000 

25 

3,0000 

50 

5,0000 


5.6. Ejercicios propuestos . 

1. Los siguientes datos corresponden a las edades (años) de 50 
pacientes elegidos al azar de un centro de salud de un mes 
determinados 


33,7 

27,6 

34,1 

24,6 

25,2 

32,3 

22,8 

32,4 

24,5 

26,9 

25,3 

28,0 

16,4 

21,0 

23,9 

24,4 

24,2 

18,2 

29,3 

22,7 

33,5 

24,6 

21,0 

17,7 

23,8 

24,8 

32,6 

40,2 

13,7 

28,7 

31,6 

21,8 

22,6 

25,7 

27,0 

21,6 

23,2 

28,2 

26,9 

24,1 

28,3 

39,1 

25,5 

24,3 

15,0 

19,3 

30,5 

25,1 

26,1 

27,3 







Elaborar el gráfico de tallos-hojas y caja, y calcular la media, 
mediana, moda, los cuarties, 4to y 7mo avo deciles y el 72 avo 
percentll, rango intercuartilico. Realice comentarlos de sus 
resultados. 

2. Los siguientes datos corresponden a las estaturas (metros) de 
50 alumnos elegidos al azar de un Instituto de estudios superior. 


1,52 

1,64 

1,69 

1,48 

1,53 

1,56 

1,86 

1,59 

1,71 

1,76 

1,56 

1,47 

1,56 

1,72 

1,60 

1,80 

1,68 

1,70 

1,46 

1,50 

1,69 

1,75 

1,71 

1,76 

1,54 

1,73 

1,58 

1,67 

1,80 

1,75 

1,68 

1,67 

1,49 

1,44 

1,68 

1,76 

1,66 

1,42 

1,53 

1,69 

1,72 

1,73 

1,74 

1,71 

1,67 

1,69 

1,67 

1,54 

1,63 

1,65 
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Elaborar el gráfico de tallos-hojas y caja, y calcular la media, 
mediana, moda, los cuartles, 3er y 6to declles y 54 avo 
percentll, rango intercuartilico. Realice comentarlos de sus 
resultados. 

3. Los siguientes datos corresponden a los montos por ventas 
semanal (miles de nuevos soles) de 50 grifos elegidos al azar 
de cierta ciudad. 


56,0 

65,6 

50,0 

61,3 

78,5 

66,0 

60,0 

58,0 

48,2 

55,4 

43,0 

45,3 

50,0 

56,5 

56,1 

75,9 

69,2 

51,9 

53,3 

74,0 

41,0 

55,1 

50,2 

50,9 

62,0 

53,7 

43,4 

69,6 

75,5 

51,9 

45,0 

74,6 

56,6 

63,2 

66,4 

48,8 

65,8 

65,0 

49,8 

55,2 

65,9 

60,8 

42,0 

74,6 

73,6 

43,9 

40,2 

40,9 

41,8 

54,5 







Elaborar el gráfico de tallos-hojas y caja, y calcular la media, 
mediana, moda, los cuartles, 4to y 7mo declles y el 35 avo y 84 
avo percentlles, rango Intercuartilico. Realice comentarlos de 
sus resultados. 

4. Los siguientes datos corresponden al número de empleados que 
laboran administrativamente en 50 garitas de peaje elegidos al 
azar de cierta reglón de un país. 

54565676787 89567657 
66567678789 56765767 
678789567657 


Elaborar el gráfico de tallos-hojas y caja, y calcular la media, 
mediana, moda, los cuartlles, 3er y 8vo declles y 36 avo y 73 
avo percentlles, rango Intercuartilico. Realice comentarlos de 
sus resultados. 
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CAPÍTULO 6 

COEFICIENTES DE ASIMETRÍA Y CURTOSIS 


INTRODUCCIÓN 

En esta parte se estudiará la forma de una distribución de frecuencias. 
Las medidas de las formas de una distribución se clasifica en dos: 
medidas de asimetría (desplazamiento de la curva hacia la derecha o 
izquierda) y medidas de curtosis (concentración de los datos con 
respecto a la media aritmética). 

6.1. CONCEPTO DE SIMETRÍA 

Cuando al trazar una recta vertical (en el diagrama de líneas o 
histograma de frecuencias de una variable, según sea esta discreta o 
continua), por el valor de la media aritmética, esta vertical se le llama 
eje de simetría; decimos que la distribución es simétrica cuando a 
ambos lados de la media aritmética existe aproximadamente el mismo 
número de valores de la variable, equidistantes de dicha media dos a 
dos; es decir que cada par de valores equidistantes tiene 
aproximadamente la misma frecuencia absoluta. En caso contrario, 
dicha distribución será asimétrica o diremos que presenta asimetría. 

6.2. MEDIDAS DE ASIMETRÍA 

Las medidas de asimetría indican la deformación horizontal de la curva. 
Cuando una distribución de frecuencias esta inclinada o alargada hacia 
la derecha, se llama asimetría a la derecha o positiva, y si esta 
alargada o inclinada hacia el lado izquierdo, se llama asimetría a la 
izquierda o negativa. Algunos criterios para determinar la asimetría de 
una distribución son: 

• COEFICIENTE DE ASIMETRÍA DE FISHER 


Este valor nos indica el desplazamiento de la distribución de los datos 
con respecto a la media aritmética y se calcula usando las siguientes 
fórmulas: 

Para datos sin agrupador: 
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lu ~ x K 



Para datos discretos agrupados 


£(*/ ~ x ) 3 f 


A f=~ 


i= 1 


ns 


Para datos continuos agrupados 


-x)/ i 

A — _Í=I_ 

~ 3 

1 ns 


Según el valor de A f , los datos tendrá una distribución asimétrica a la 
izquierda, asimetría a la derecha o será simétrica, esto es: 

A f & O , la distribución de los datos será simétrica. Los datos se 
desplazan a la izquierda y derecha de la media aritmética. 

A f > O , la distribución de los datos será asimétrica a la derecha o 

asimetría positiva. Los datos se desplazan a la derecha de la media 
aritmética. 


A f < O , la distribución de los datos será asimétrica a la izquierda o 

asimetría negativa. Los datos se desplazan a la izquierda de la media 
aritmética. 

Ejemplo 

La tabla de distribución de frecuencia, corresponde a edades (años) de 
usuarios que concurren a un centro de información. 
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Edades (años) 

/, 

X.’ 

1 

C 

18.5-22.5 

3 

20.5 

3 

22.5-26.5 

4 

24.5 

7 

26.5-30.5 

14 

28.5 

21 

30.5-34.5 

12 

32.5 

33 

34.5-38.5 

5 

36.5 

38 

38.5-42.5 

4 

40.5 

42 

Total 

42 




La distribución de frecuencias de las edades, que tipo de asimetría 
tiene. 

Cálculos: 




30.7857143 


s 2 = 




= 27.4285714—> s 


n — 1 

¿(v^- v)/ ,=235.101993 


3 = 42 * (5.23722937) 3 = 6033.28824 




235 101993 

A = = 0.0389 > 0 


f 6033.28824 


a/27.4285714 = 5.23722937 


La distribución de las edades es ligeramente asimétrica positiva, es 
decir los datos tienen un desplazamiento casi a ambos lados de la 
media aritmética. 


COEFICIENTE DE ASIMETRÍA DE PEARSON 


Este coeficiente de asimetría se utiliza cuando se conoce los valores de 
la media aritmética, mediana, moda y desviación estándar. 

A _x-m 0 _ 3(x —m e ) 

/i — - — 

Pe 
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Esta formula se aplica, cuando la distribución de frecuencias de los 
datos unimodal. 

A « 0 , la distribución de los datos será simétrica. Los datos se 
desplazan a la izquierda y derecha de la media aritmética. 

A > 0 , la distribución de los datos será asimétrica a la derecha o 
asimetría positiva. Los datos se desplazan a la derecha. 

A p < 0 , la distribución de los datos será asimétrica a la izquierda o 
asimetría negativa. Los datos se desplazan a la izquierda. 

De la tabla de distribución de frecuencias anterior, calcular el 
coeficiente de asimetría de Pearson. 

De la tabla: 

x = 30.7857143 

m e = 30.5 

5 = 5.23722937 

, 3(30.7857143-30.5) 

A= - ^0.1636 

p 5.23722937 

Las edades, tienen una distribución asimétrica a la derecha. 

• COEFICIENTE DE ASIMETRÍA DE BOWLEY 

Este coeficiente se utiliza, cuando no es posible calcular la media y 

desviación estándar 

* _ Q\ + Q? ~ 2Q 2 
b ~ Q 3 -Qi 

Siendo: 

Q x = Valor del primer cuartil 
Q 2 = Valor del tercer cuartil 
<2 3 = Valor del segundocuartil 

A b & 0 , la distribución de los datos será simétrica 

A b > 0 , la distribución de los datos será asimétrica a la derecha o 

asimetría positiva. 
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A b < 0 , la distribución de los datos será asimétrica a la izquierda o 
asimetría negativa. 

De la tabla de distribución de frecuencias anterior, calcular el 
coeficiente de asimetría de Bowley. 

De la tabla: Q¡= 27.5 Q 2 = 30.5 Q 3 = 34 , reemplazando valores 


4 _ 27.5 + 34 - 2(30.5) _ Q Qg 
b 34 -27.5 


Las edades, tienen una distribución asimétrica a la derecha. 


6.3. COEFICIENTE DE CURTOSIS 


La curtosis es la deformación vertical (apuntamiento) de una 
distribución de frecuencias. Este coeficiente determina el grado de 
concentración de los datos con respecto a la media aritmética; se 
calcula cuando la distribución de frecuencias tiene la forma simétrica 
(forma de campana). El coeficiente de curtosis se calcula por la 
siguiente fórmula: 



atos no agrupados 

(T ~ x ) 4 


k = ‘ 


.-3 


Para datos discretos agrupados 

X (*«-f 


i =1 


ns 


Para datos continuos agrupados 


Y(xt-x)f i 
k=^ -3 


ns 


k = 0 , la distribución será mesocúrtica o normal, concentración normal 
de los datos con respecto a la media aritmética. 
k > 0 , la distribución será leptocúrtica o mas apuntada que la normal, 
alta concentración de los datos con respecto a la media aritmética 
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k < 0, la distribución será platicúrtica o menos apuntada que la normal, 
baja concentración de los datos con respecto a la media aritmética 

Otro coeficiente de curtosis en función de cuartiles y percentiles es: 

k= Qi ~ Q] 

2(^90 ^* 10 ) 

k- 0.263, la distribución de frecuencias será mesocúrtica o normal 

k > 0.263, la distribución de frecuencias será Leptocúrtica más 
apuntada que la normal, los datos se encuentran más concentrados a 
la media aritmética k < 0.263, la distribución de frecuencias será 
Platicúrtica, menor apuntada que la normal, los datos se encuentran 
menos concentrados a la media aritmética. 

Ejemplo aplicativo: 

La tabla de distribución de frecuencias, corresponde a las edades 
(años) de 42 usuarios que concurren a un centro de información. 


Edades(años) 

/, 

X. 

1 

18.5-22.5 

3 

20.5 

22.5-26.5 

4 

24.5 

26.5-30.5 

14 

28.5 

30.5-34.5 

12 

32.5 

34.5-38.5 

5 

36.5 

38.5-42.5 

4 

40.5 

Total 

42 



¿A que tipo de apuntamiento corresponde la distribución de las edades 
de los usuarios?. 

Cálculos: 

6 

£( x-xjf i = 81 , 260.2216 

i=\ 

6 

'Zix-x)/ 2 , = 1124.57143 

k = 42(8126 °' 2216) - 3 = 2 . 698691 - 3 = - 0 . 301309 < 0 
( 1124 . 57143) 2 
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La distribución de frecuencias de las edades será platicurtica. 
Usando el otro coeficiente se tiene: 

De la tabla de distribución frecuencias se tiene: 

Q 3 = 34 
2 ,= 27.5 


P g 0 = 38.34 
= 23.7 

k _ Q*-Qi _ 34 - 27.5 

2(P 9 0 - P 10 ) 2 ( 38 . 34 - 23 . 7 ) 


0.22199 


La distribución de las edades será platicurtica; esto implica que las 
edades de los usuarios están poco concentrados con respecto a la 
media aritmética. 

Otra fórmula para calcular el coeficiente de curtosis: 

í n(n +1) " jc — JC- 4 I 3(n -l) 2 

k = \ _ h _ 

l(n-l)(n-2)(n-3) ¡=1 s J (n-2)(n-3) 


Siendo: x y s I a media aritmética y la desviación estándar 
respectivamente. 

k = 0 , la distribución será mesocúrtica o normal, media concentración 
de los datos con respecto a la media aritmética. 

k > 0 , la distribución será leptocúrtica o mas apuntada que la normal, 
alta concentración de los datos con respecto a la media aritmética 

k < 0, la distribución será platicúrtica o menos apuntada que la normal, 
baja concentración de los datos con respecto a la media aritmética 

Aplicando el SPSS para realizar el cálculo de la simetría, asimetría, 
curtosis 

Definiendo las variables 
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íaf 'S<n btulol IConjuntoDatosOI * I8M SPSS StabstKi Editor de detos 
Ai enrío Edrtar ¿ai Qatos Transí ormar ^alizar Grábeos 


!N@ 


h ■; -a a 


toménco 8 


MeM Rol 

f Escala Entrada 


IBM SPSS Statistics Processoi «U >tto_ Unicode OH 


I P Escribe aquí para buscar 


Ingresando los datos 


3H ¡Mi 


[É 3 ^2 3 


tA r*B 
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En el Menú del SPSS escoger ANALIZAR-ESTADÍSTICOS 
DESCRIPTIVOS—FRECUENCIA-pasar la variable Peso_reclen_nacldo 
a la casilla de la derecha-ESTADISTICOS-caracterlzaclón posterior 
marcar asimetría y curtosis-CONTINUAR-ACEPTAR 


Caitos Transformar Anadear Gráficos UttlidarMs Amellactonss Pantana *iyda 



I P Escribe aquí para buscar 


Q I» • 


IBM SPSS Statsacs Ptocássor esta as 


« J • a* 


Estadísticos 

Peso reden nacldol 


N Válido 

34 

Perdidos 

0 

Asimetría 

-,308 

Error estándar de asimetría 

,403 

Curtosls 

-,728 

Error estándar de curtosls 

,788 
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6.4. Ejercicios propuestos 

1. En una agencia bancaria, el tiempo (en minutos) de atención a 
los 70 clientes se presenta en la siguiente tabla de distribución 
de frecuencia: 


Tiempo (minutos) 

/,- 

[1.5 

2.0) 

2 

[2.0 

2.5) 

6 

1 O 

[2.5 

3.0) 

30 

[3.0 

3.5) 

12 

[3.5 

4.0) 

6 

[4.0 

4.5) 

2 

[4.5 

5.0) 


Total 

70 


Hallar e interprete el coeficiente de asimetría y el coeficiente de 
curtosis. 

2. Los datos que a continuación se presentan corresponden a 

edades de 60 usuarios que concurren a un centro de información 
(biblioteca) 


Edad(años) 

fi 

18.5-22.5 

4 

22.5-26.5 

24 

26.5-30.5 

15 

30.5-34.5 

10 

34.5-38.5 

5 

38.5-42.5 

2 

Total 

60 


Hallar e interprete el coeficiente de asimetría. 

3. Los datos que a continuación se presentan corresponden a 
edades de usuarios que concurren a un centro de información 
(biblioteca) 
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Edad(años) 

A, 

12-14 

0.02 

14-16 

0.2 

16-18 

0.56 

18-20 

0.2 

20-22 

0.02 

Total 

1.0 


Hallar e interprete el coeficiente de curtosis. 

4. Los datos que a continuación se presentan corresponden a las 
estaturas (mts.) de 44 alumnos elegidos al azar, de la 
universidad Nacional Mayor de San Marcos. 


Estaturas (mts) 

f, 

1.65-1.68 

3 

1.68-1.71 

10 

1.71-1.74 

17 

1.74-1.77 

8 

1.77-1.80 

4 

1.80-1.83 

2 

Total 

44 


Hallar e interprete el coeficiente de asimetría. 

5. Los datos que a continuación se presentan corresponden a 
montos por ventas (miles de nuevos soles) de 60 
establecimientos comerciales de Lima Metropolitana. 


Montos de ventas 

f 

12.5-17.5 

2 

17.5-22.5 

5 

22.5-27.5 

23 

27.5-32.5 

23 

32.5-37.5 

5 

37.5-42.5 

2 

Total 

60 


Hallar e interprete el coeficiente de curtosis. 
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CAPÍTULO 7 

VARIABLES BIDIMENSIONALES 


INTRODUCCIÓN 

En esta CAPÍTULO se estudiaran las variables bldlmenslonales, las 
cuales se presentan cuando se observan en forma simultánea dos 
variables (X;F) en la unidad elemental, en una población o muestra 

aleatoria. 

7.1. VARIABLES BIDIMENSIONALES 

Las variables bidimensionales (X, Y) pueden ser ambas cualitativas 
o cuantitativas o bien una mezcla de ambas. Cualquiera que sea el 
caso los datos se clasifican bajo dos criterios y se presentan en tabla 
de doble entrada o tabla de contingencia. 

Ejemplos: 

• Estaturas y pesos de los alumnos de la Universidad Nacional 
Mayor de San Marcos 

• Sexo y Opinión de los encuestados 

• Número de heridos y causas de los accidentes de transito 

• Gasto e ingreso de los jefes de familia 

• Altura v diámetro de los árboles 

• Grado de Instrucción y adaptabilidad al matrimonio de los. 
cónyuges 

• Número de personas y cantidad de habitaciones en una casa 

Supongamos que la variable X se clasifica en “m” clases y la variable Y 
en “k” clases. Cada fij nos Indica el número de veces que la unidad 

elemental presenta la clase X¡ e simultáneamente, 

obteniéndose de esta forma una distribución conjunta de las variables 
X e Y. Ver tabla 01 
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Tabla 01 


\y 

X X, 

Y, 

y 2 


Y k 

Total 

Y 

fu 

fn 


fu 

/,. 


fn 

fl 2 


flk 

A 








fin 1 

f m 2 


f mk 

A. 

Total 

/, 

fi 


L 

/. 


Ejemplo 


De 98 Tesis de Física elegidas al azar, se observó simultáneamente 
dos variables de Interés: 

X = Sexo del autor de la tesis 
Y = Calificativo en la sustentación 

Tabla 02 


Distribución conjunta de las frecuencias de las variables, sexo del autor 
de la tesis (X) y calificativo en la sustentación (Y) 


Calificativo 






Sexo x. 

Excelente 

Muy 

Bueno 

Bueno 

Regular 

Total 

Varón 

8 

12 

15 

12 

47 

Dama 

6 

10 

20 

15 

51 

Total 

14 

22 

35 

27 

98 
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Fuente: Biblioteca Central de la Universidad Nacional Mayor de San 
Marcos 

Interpretación: 

fu =8 (Significa que existen 8 tesis de física que corresponden a 
varones y obtuvieron el calificativo de excelente). 

,/l. =47 (Significa que existen 47 tesis de física, cuyos autores son 
varones,). 

f 2 =22(Significa que existen 22 tesis de física que obtuvieron el 
calificativo de muy bueno. 

La Tabla 02, también puede presentarse por sus frecuencias relativas 
para cada casillero. 

Tabla 03 


Distribución Conjunta de las frecuencias relativas porcentuales de las 
variables, sexo del autor de la tesis (X), y calificativo en la sustentación 

m ______ 


Calificativo 

Sexo 

Excelente 

Muy 

Bueno 

Bueno 

Regular 

Total 

Varón 

8.16% 

12.24% 

15.31% 

12.24% 

47.96% 

Dama 

6.12% 

10.20% 

20.41% 

15.31% 

52.04% 

Total 

14.29% 

22.45% 

35.71% 

27.55% 

100.00 

% 


Fuente: Biblioteca Central de la Universidad Nacional Mayor de San 
Marcos 

7.2. DISTRIBUCIONES MARGINALES 

Si de la tabla 01, consideramos sólo los totales para las categorías de 
X , sin tener en cuenta las categorías de Y, se obtiene la distribución 
marginal de X ; es decir: 
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TABLA DE DISTRIBUCIÓN MARGINAL DE X 


X 

/, 

T 

/, 

x 2 

A 



X» 

L. 

Total 

f 


De la misma forma la distribución marginal para Y será: 

TABLA DE DISTRIBUCIÓN MARGINAL DE Y 


Y 

f. 

T 

A 

y 2 

f .2 



Y t 

A 

Total 

/. 


7.3. DISTRIBUCIONES CONDICIONALES 

Se obtiene al poner una restricción o condición a una de las dos 
variables; es decir: 
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Distribución condicional de X dado Y , se simboliza por: x / 

7 y = ¥ j 

TABLA DE DISTRIBUCIÓN CONDICIONAL DE x/ 


II 

y. 

x. 

fu 

x 2 

flj 




f . 

Jmj 

Total 

f. 


También la distribución condicional de Y dado X , se simboliza por: 



TABLA DE DISTRIBUCIÓN CONDICIONAL DE y , 


x = x 


x 

II 


y, 

fn 

y 2 

fn 



Y k 

fu 

Total 

/, 
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7.4. INDEPENDENCIA ESTADÍSTICA 

Se dice que dos variables X e Y , son independientes 
estadísticamente, cuando las frecuencias relativas conjuntas es Igual al 
producto de las frecuencias relativas marginales para todas las celdas 
de la tabla 01; es decir, 




f. 


V, 


SI esta condición no se cumple para todas las celdas, se dice que hay 
dependencia estadística. 

Medias y Variancias Marginales: 

De la tabla 01 sea la variable bldlmenslonal (X ,Y ). Las medias y 
variancias marginales de X e Y , son dadas por: 


n 

-X) 2 A 

S ¡ =-= 1 - 

n 

k 

Z y/.j 

j=i 


2 i =i_ 
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Siendo: " = 4 

f= 1 7=1 


[i = 1,2,3,-.^ 
j= 1,2,3,-r 

l 


7.5. COVARIANCIA 


Es el estudio de la variabilidad conjunta de dos variables aleatoria, la 
medida que se utiliza para cuantificar esta relación es: 


Z Z _ - y) fu Z Z 


*¡y¡-nxy 


s xy = Cov(x, y) = 


1=1 7=1 


1=1 7=1 




71 


1 Z 

¿=l 7=1 


> 0 —> Hay dependencia lineal directa (positiva); es decir a 
grandes valores de X , corresponden grandes valores de Y . 

Sxy — 0 —> No hay dependencia lineal entre las variables (están 
incorrelaclonadas); es decir no hay relación lineal 
s» < 0 —> Hay dependencia lineal inversa o negativa; es decir a 
grandes valores de X , corresponden pequeños valores de Y . 

• Propiedades de la Covariancia 


1. 


2 . 


SI a todos los valores de la variable X e F , les sumamos una 


constante K ; la covariancia original no cambia. 

XeY . 

SI a todos los valores de la variable > l es multiplicamos 


por una constante 


k { y k 2 


respectivamente, la 
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3. 


covariancia original queda multiplicada por el producto de las 
constantes. 

Sea S xy , la covariancia de la variable bidimensional X e Y , 
sean las transformaciones lineales para cada variable 
Z = ÜX + b , W = cy + d , la nueva covarlanza es dada por: 


S = acS 

zw ^ 


Coeficiente de correlación lineal de X e Y 


El inconveniente de la covariancia, como medida de asociación es su 
dependencia de las unidades de medidas que utiliza. Para salvar esta 
dificultad, se define otra medida de la asociación como la correlación, 
que no está afectada por las unidades de medidas. 


xy 


Covjx , y) 

s x -s y 


Ejemplo aplicativo 


Sea la tabla de datos 

Tabla 01 


N°de 

hijos(x) 

2 

3 

4 

2 

4 

3 

5 

2 

2 

3 

N°de 

dormitorios 

(Y) 

1 

2 

2 

1 

2 

1 

2 

1 

2 

1 


Elaborar la tabla de distribución de frecuencias de X e Y 


Tabla 02 


^\(Y) 

1 

2 

Total 

(X) 




2 

3 

1 

4 

3 

2 

1 

3 

4 

0 

2 

2 

5 

0 

1 

1 

Total 

5 

5 

10 
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Hallar las distribuciones marginales de X e Y 
Distribución marginal de X 

Tabla 03 


X 

/, 

2 

4 

3 

3 

4 

2 

5 

1 

Total 

10 


Distribución marginal de Y 


Tabla 04 


Y 

fy 

1 

5 

2 

5 

Total 

10 


Distribución condicional de Y dado X=3 

Tabla 05 


Y 

f(y/x = 3) 

1 

2 

2 

1 

Total 

3 


Calcular la covariancia 


Utilizando la formula de la covariancia, con los datos de la tabla 02 

s - = ttÍ] 'Lf, i x i y¡)-~x~y 

1U '=' 7=1 


xy 


S = _í(3)(2)(l) + (1)(2)(2) + (2)(3)(1) + (1)(3)(2) + (2)(4)(2) + (1)(5)(2) - 3(1.5) 
” 10 


*y 


0.3 


Calcular la variancla marginal de X 
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De la tabla 03 

3 

I>,¿ = 2(4) + 3(3) + 4(2) + 5(1) = 30 

¡=1 

y xf, = 2 2 (4) + 3 2 (3) + 4 2 (2) + 5 2 (1) = 100 

l=f 


100 -( 30) 2 

5 2 - d1 ° -1 

10 

Calcular la varlancla marginal de Y 
De la tabla 04 

¿>,/¡ =1(5)+ 2(5) = 15 

i=l 

¿j?/,. = l 2 (5) + 2 2 (5) = 25 


25-(15)! 

s 2 = _Ü10 =0 25 
10 

Calcular el coeficiente de correlación de X e Y 

Utilizando la formula de la correlación y los cálculos obtenido 
anterlorrr^ente 

r = ” = 0-3 = Q.6 

xv S x .S y a/1; 0.25 
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De otra forma de la tabla 01 
10 



(=1 

10 


= 30 

1=1 

10 


YjX?= 100 


i=l 

10 


Z x- - 15 


í= 1 
10 


Er = 25 


El coeficiente de correlación de Xe Y 


io 

:¡y, ——- — - 

Í7 0 ¿y,r 

io y.- —' 1 o— 

. = _ 3 = 3 = 3 = 0.6 
" 10. 2.5 a/25 5 



(30X15) 


1Q 


(3GX 

<13 )- 

, ioo- 

- 25- 

V ÍO 

V IO 


Aplicando el SPSS para realizar tablas cruzadas o de contingencia 
Definiendo las variables 
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Ingresando los datos 



I P Escribe aquí para buscar 




En el Menú del SPSS escoger ANALIZAR-ESTADISTICOS 
DESCRIPTIVOS—TABLAS CRUZADAS-pasar la variable sexo a la 
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casilla filas y la variable Calificación de la tesis la columnas -CASILLAS- 
CONTINUAR-ACEPTAR 


Q 



P Escribe aquí para buscar 


rrrwrr 



Tabla cruzada Sexo*Calificacion de la tesis 


Bueno 

Calificación de la tesis 

Muy 

Excelente bueno 

Regular 

Total 

Sexo Dama Recuento 

20 

6 

10 

15 

51 

% del total 

20,4% 

6,1% 

10,2% 

15,3% 

52,0% 

Varón Recuento 

15 

8 

12 

12 

47 

% del total 

15,3% 

8,2% 

12,2% 

12,2% 

48,0% 

Total Recuento 

35 

14 

22 

27 

98 

% del total 

35,7% 

14,3% 

22,4% 

27,6% 

100,0% 
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7.6. Ejercicio propuesto: 

a. Elaborar una tabla de doble entrada con los datos que 



Con la Información elaborar la tabla de doble entrada e Interpretar 
algunos resultados. 


b. Los siguientes datos corresponden a una encuesta 
tomada a 56 alumnos de la Universidad Nacional 
Mayor de San Marcos, con la finalidad de evaluar los 
servicios que prestan a los usuarios la biblioteca 
Central. 


c. 



LEYENDA 

SEXO: V = VARON M= MUJER 

SERVICIOS DEL Cl (Centro de Información): M=MALO 
R=REGULAR B= BUENO 

Con la Información elaborar la tabla de doble entrada e Interpretar 
algunos resultados. 


208 




































































































EsTADÍSTICa DESCRiptiva V pRoBABILIDAd pARa LAS CIENCIAS DE LA INFORMAciÓn CON El USO DEl SPSS 


CAPÍTULO 8 


INTRODUCCIÓN 

En este capítulo, se estudia la relación lineal o no lineal entre dos 
variables (X ,Y ) con el objetivo de conocer si estas están asociadas o 
dependientes 

8.1. COEFICIENTRE DE CORRELACIÓN DE PEARSON 

Es un valor que mide el grado de asociación lineal entre dos variables 
cuantitativas (X ,Y ) 


Sean (*, , y l ), (x 2 , y 2 ), (x 3 , y 3 ), ( x n , y „) datos de dos variables de 

una muestra aleatoria de tamaño n extraídas de una población. El 
coeficiente se calcula por la fórmula: 


~y) 


T x .y 




w 


. □/=! 


(.x.-xf.i £(y-y ) 2 






■•Er 


<Zíl 


Sí r p -0 , entonces los valores que toma la variable (X ), no están 
asociadas Hnealmente. 


Sí r p -> 1 , entonces los valores que toma la variable (X ,Y ), están 

asociadas Hnealmente; es decir, si X crece, también Y crece 
(viceversa). 

Si r p —» — 1, entonces los valores que toma la variable (X ,Y ), están 
asociadas Hnealmente; es decir, si X crece Y decrece (viceversa). 

Ejemplo 

Se eligen al azar 10 estudiantes y se registran sus notas de estadística 
I y estadística II, tal como se presenta en el cuadro: 
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X 

Y 

13 

13 

12 

12 

14 

15 

15 

15 

16 

17 

14 

16 

13 

14 

15 

16 

11 

12 

13 

15 


¿Se encuentran los datos correlacionados? 


Calculando las sumatonas 


10 

= 1993 


10 

X-r¡= 136 


Zv,=l45 


10 

X •* = 1870 


£)í=2129 


r 

p 


1993 -^ 13 % 145) 

I 136 2 I 

1870 --, 2129 - 

io V 


145 

2 

10 


0.9032 


Conclusión: las notas de los estudiantes obtenidas en el curso de 
estadística I y II están asociadas o correlacionadas llnealmente 

8.2. COEFICIENTE DE CORRELACIÓN DE RANGOS DE 

SPEARMAN 


Es un valor que mide el grado de asociación lineal o no lineal entre dos 
variable cualitativas ordinales o jerárquicas (X,Y ), los datos de ambas 
variables se ordenan por rangos creciente o decreciente 

Para una muestra aleatoria de tamaño n , sea (x, x , x ,...x ) los 

12 3 n 

datos de la primera variable con sus rangos correspondientes 
(x r , x r , x r x r ); para los valores de la segunda variable 

12 3 n 
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(y ,y ,y ,... y ) con sus rangos correspondientes (/, /, /). 

12 3 n 12 3 n 

El coeficiente se calcula por la fórmula: 

6 .¿ í /, 2 
r =1- D Í '~ 
s n(n 2 —1) 

Donde: d = x r - y r 

i i i 

Si r p = 0 , entonces los valores que toma la variable (X ,Y) , no están 
asociadas. 

SI r p —> 1 , entonces los valores que toma la variable (X ,Y ), están 

asociadas; es decir, si X crece también Y también crece 
(viceversa). 

SI r p —» -1, entonces los valores que toma la variable (X ,Y) , están 
asociadas; es decir, si X crece Y decrece (viceversa). 

Nota 

Cuando hay empates de rangos, tanto para los valores de X como Y , 
al momento de asignarle sus rangos, se asigna a las observaciones 
empatadas la media aritmética de los rangos se cumple que 
Ejemplo 


X 

7 

6 

5 

6 

4 


5 

3 

2 

4 

1 

r 

5 

3.5 

2 

3.5 

1 


Nota 


Cuando no hay empates de rangos, tanto para los valores de X como 
Y , se cumple que el coeficiente de correlación de Spearman es igual al 
coeficiente de correlación de Pearson calculado por los rangos. 


Nota 



Cuando hay algunos empates de rangos, tanto para los valores de X 
como Y, el coeficiente de correlación de Spearman es 
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aproximadamente igual al coeficiente de correlación de Pearson 
calculado por los rangos. 


Ejemplo 

Se eligen al azar 7 estudiantes y se registran las X =horas de estudios 
dedicados a la asignatura de matemática con sus correspondientes 
Y = notas obtenidas a la referida asignatura: 


X 

Y 

8 

12 

5 

11 

11 

14 

13 

15 

10 

13 

5 

12 

8 

13 


¿Calcular el índice de correlación de Spearman? 
Se calcula los rangos para cada variable 


X 

Y 

x' 

y, r 

d i =x r i -y. 

df 

8 

12 

3.5 

2.5 

1 

1 

5 

11 

1.5 

1 

0.5 

0.25 

11 

14 

6 

6 

0 

0 

13 

15 

7 

7 

0 

0 

10 

13 

5 

4.5 

0.5 

0.25 

5 

12 

1.5 

2.5 

-1 

1 

8 

13 

3.5 

4.5 

-1 

1 





total 

3.5 


Usando la formula 


n 1 



n(n 2 -1) 7(7 2 -1) 


6(3.5) 

7(49-1) 


0.9375 


Conclusión: las horas de estudio dedicadas a la asignatura matemática, 
están asociadas a las notas obtenidas. 
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Aplicando el SPSS para realizar el índice de correlación de Pearson 
Definiendo las variables 
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Escribe aquí para buscar 
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Ingresando los datos 


SHSlSn íi3 _Jt *a 


I P Escribe aquí para bi 


Q » W 


213 


















EsTADÍSTICa DESCRiptiva V pRoBABILIDAd pARa LAS CIENCIAS DE LA INFORMAciÓn CON El USO DEl SPSS 


En el Menú del SPSS escoger ANALIZAR-ESTADÍSTICOS 
DESCRIPTIVOS—TABLAS CRUZADAS-pasar la variable X y la 
variable Y al casillero de la derecha, marcar Pearson-ACEPTAR 


Q -Sm Mulo’ tConjuntoOatosI] 

AWilvo E9Qr \¡er Datos 


Iranstormar «patear Gráficos UIMdadoo «mciiaaonts ventana 


3Hi 


■-» H OS J o_H 


le: 2 de 2 vanados 



✓ xpq 

✓ y(Y) 


Esttlo 

| Simulat muest 


•/ PearsoQ [I Tau-6 de ¡Sondan Spoarman 

Pmooa do stonAcaodfl 

• Bilateral O Unilateral 

•/ SoAaiar las correlaciones significativas 

[ «copiar I EogQt Boiudik» Cancotor | «ruda 


la de datos -isa do vanados 


I P Escribe aquí para buscar 




Correlaciones 


X 

Y 

X Correlación de Pearson 

1 

,903** 

Sig. (bilateral) 


,000 

N 

10 

10 

Y Correlación de Pearson 

,903** 

1 

Sig. (bilateral) 

,000 


N 

10 

10 


**. La correlación es significativa en el nivel 0,01 


(bilateral). 

Aplicando el SPSS para realizar el Indice de correlación de Spearman 
Definiendo las variables 
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Ingresando los datos 

"Sin IiluloS |Con,ontoOMoi2) - IBM SPSS SMfeta Editor de detoi 



I Escribe aquí para buscar 
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En el Menú del SPSS escoger ANALIZAR-ESTADÍSTICOS 
DESCRIPTIVOS—TABLAS CRUZADAS-pasar la variable X y la 
variable Y al casillero de la derecha, marcar Spearman-ACEPTAR 

tí -Sm Utulo3 IConjuntoO«toi2] - IBM SPSS SUtebu Edito, de deto» O X 

•tamo E<**3' W» Iranilormar írncar Critico» Utilidades Amcliaaones ventana *njda 



Correlaciones 


X 

Y 

Rho de X Coeficiente de 

Spearman correlación 

1,000 

,787* 

Sig. (bilateral) 


,036 

N 

7 

7 

Y Coeficiente de 

correlación 

,787* 

1,000 

Sig. (bilateral) 

,036 


N 

7 

7 


*. La correlación es significativa en el nivel 0,05 (bilateral). 
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CAPÍTULO 9 

TÉCNICAS DEL CONTEO 


INTRODUCCIÓN 

El objetivo de este capítulo es presentar las formulas y técnicas que 
permiten determinar el total de grupos que se pueden formar con ios 
elementos de uno o más conjuntos. Los grupos formados pueden ser 
sin reemplazo o con reemplazo y a la vez tomando en cuenta o no el 
orden de sus elementos. 

Sean los dígitos {l, 2, 3}, se eligen 2 dígitos para formar un número, 
determinar los números formados: 


12 

13 

23 

sin reemplazo y sin orden 

12 

13 

23 


21 

31 

32 

sin reemplazo y con orden 

12 

13 

23 


11 

22 

33 

con reemplazo y sin orden 

12 

13 

23 


21 

31 

32 

con reemplazo y con orden 

11 

22 

33 


Orden, es 

permutar los elementos dentro del grupo 


Sin reemplazo, el elemento elegido aparece una solo vez en el grupo 
Con reemplazo, el elemento elegido aparece más de una vez en el 
grupo 

9.1. Con un solo conjunto 

• SI se tiene un conjunto con “n” elementos diferentes, 
todos los posibles grupos que se pueden formar, si se 
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toman “r” elementos (para r<n), sin tomar en cuenta el 
orden y sin reemplazo, es dado por: 


r r\(n — r)! 

• SI se tiene un conjunto con “n” elementos diferentes, 
todos los posibles grupos que se pueden formar, si se 

toman “r" elementos (para r - n ), sin tomar en cuenta el 
orden y con reemplazo, es dado por: 

C n + r-\ = (n + r- 1)! 
r r\(n —1)! 

• SI se tiene un conjunto con “n” elementos diferentes, 
todos los posibles grupos que se pueden formar, si se 

toman “r" elementos (para r - n ), tomando en cuenta el 
orden y sin reemplazo, es dado por: 


r {n-r)\ 

Un caso particular, es cuando t —W Juego Vn =n • 




SI se tiene un conjunto con “n” elementos diferentes, 
todos los posibles grupos que se pueden formar, si se 

toman “r” elementos (para r - n ), tomando en cuenta el 
orden y con reemplazo, es dado por: 


n 


r 


• SI se tiene un conjunto con “n” elementos de los cuales 

son ¡guales, n - son ¡guales,..., Hp son ¡guales, donde 

p 

se cumple que =n , luego el total de permutaciones 

i=i 

para los “n” elementos es: 
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n\ 

(n 1 !)(n 2 !)...(n p !) 


9.2. Con dos o más conjuntos 

• Principio de la multiplicación 

Un acontecimiento puede ocurrir de “a “formas diferentes, otro de “b” 
formas diferentes, y así sucesivamente, hasta que un acontecimiento 
puede ocurrir de “m” formas diferentes; entonces el total de formas 
que puede ocurrir un acontecimiento completo (tomando un solo 
elemento de cada conjunto), es dado por: 

(a )(b)...(m) 

• Principio de la suma 

Un acontecimiento puede ocurrir de “a” maneras diferentes, otro de 
“b” maneras diferentes, y así sucesivamente, hasta que un 
acontecimiento puede ocurrir de “m” maneras diferentes. Suponiendo 
que los acontecimientos son mutuamente excluyentes(es decir si 
ocurre uno de los acontecimientos ya no pueden ocurrir otros); 
entonces cualquiera de los acontecimientos pueden ocurrir por la suma 
de las maneras; es decir, 

a + b + ... + m 


9.3. Ejercicios resueltos 

1. Un estudiante para ir a la Universidad nacional de ingeniería 
(UNI), dispone de 8 líneas diferentes del metropolitano o de 4 
líneas diferentes de microbús, de cuantas maneras diferentes se 
puede llegar a la UNI. 

Como los dos eventos son excluyentes(es decir si utilizo 
cualquier línea del metropolitano ya no podre usar cualquier línea 
de microbús y viceversa) el total de maneras es dado por la 
suma de cada acontecimiento: 

8+4=12 

(i ? 3 4 \ 

2. Sean los dígitos ' ’ ’ ’ i , se eligen 3 dígitos sin 

reemplazo, cuántos números de tres cifras se pueden formar. 
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Como el número a formarse es de tres dígitos, el primer dígito se 
puede elegir de 4 maneras diferentes; como es sin remplazo el 
segundo dígito se puede elegir de 3 maneras diferentes y por 
último el tercer dígito se puede elegir de 2 maneras diferentes. 
Por lo tanto el total de números de tres dígitos que se pueden 
formar es dado por (4)(3)(2) = 24 (principio de la 


multiplicación) 

¿ 

Por formula 


4! 

(4 -3)! 


4x3x2xl 

1 


24 


SI la elección es con reemplazo, por el principio de la 
multiplicación (4)(4)(4)=64 

Por formula n r = 4 3 = 64 

3. Sean los dígitos { 1,2, 3, 4, 5, 6, 7, 8, 9}, se eligen 3 dígitos al 
azar y con reemplazo para formar un número. Hallar el total de 
números que se pueden formar en los siguientes casos: 


a. Formar todos los posibles números. 

Como las extracciones son con reemplazo, el primer, 
segundo y tercer dígito pueden ocurrir de 9 formas diferentes, 
entonces por el principio de la multiplicación se tiene: 


9 


9 


9 


El total de formas diferentes de formar números con tres 
dígitos es dado por la multiplicación de 9x9x9=729. 


b. 


Formar números pares 

Un numero es par cuando la ultima cifra es par o cero, 
entonces el último dígito puede ocurrir de 4 formas diferentes 
( 2,4,6,8) y como es con restitución el primer y segundo 
dígito pueden ocurrir de 9 formas diferentes, entonces por el 
principio de la multiplicación se tiene: 
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El total de número pares que se pueden formar con tres 
dígitos es dado por la multiplicación de 9x9x4=324. 


c. Formar números mayores que 500 

El primer dígito puede ocurrir de 5 formas diferentes para que 
sea mayor a 500 (5,6,7,8,9), y como es con restitución el 
segundo y tercer dígito pueden ocurrir de 9 formas diferentes, 
entonces por el principio de la multiplic ación se tiene: 


El total de números que se pueden forman con tres dígitos 
mayores a 500 es dado por la multiplicación de 5x9x9=405. 


d. Formar números de tal manera que el dígito 3 se encuentre 
en el centro. 

El primer dígito puede ocurrir de 9 formas diferentes, el 
segundo dígito puede solo ocurrir de una 1 sola forma 
(corresponde al número 3) y tercer puede ocurrir de 9 formas, 
entonces por el principio de la multiplic ación se tiene: 


1 


El total de números que se pueden formar, de tal manera 
que el número 3 se encuentre en el centro es dado por la 
multiplicación de 9x1 x9=81. 

4. Sean los dígitos { 1,2, 3, 4, 5, 6, 7, 8, 9}, se eligen 3 dígitos al 
azar y sin reemplazo para formar un número. Hallar el total de 
números que se pueden formar en los siguientes casos: 


a. Formar todos los posibles números 

Como las extracciones son sin reemplazo, el primer, segundo 
y tercer dígitos pueden ocurrir respectivamente de 9, 8 y 7 
formas diferentes, entonces por el principio de la 
multiplicación se tiene: 


8 


El total de números con tres dígitos es dado por la 
multiplicación de 9x8x7=504. 


b. Formar números pares 

Un numero es par cuando la ultima cifra es par o cero, 
entonces el último dígito puede ocurrir de 4 formas diferentes 
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( 2,4,6,8) y como es sin restitución el primer y segundo dígito 
pueden ocurrir de 8 y 7 formas diferentes, entonces por el 
principio de la multiplicación se tiene: 


8 


El total de número pares que se pueden formar con tres 
dígitos es dado por la multiplicación de 8x7x4=224. 


c. 


Formar números mayores que 500 

El primer dígito puede ocurrir de 5 formas diferentes para que 
sea mayor a 500 (5,6,7,8,9), y como es sin restitución el 
segundo y tercer dígito pueden ocurrir de 8 y 7 formas 
diferentes, entonces por el principio de la multiplicación se 
tiene: 


5 


8 


7 


El total de números que se pueden forman con tres dígitos 
mayores a 500 es dado por la multiplicación de 5x8x7=280. 


d. Formar números de tal manera que el dígito 3 se encuentre 
en el centro 

El primer dígito puede ocurrir de 8 formas diferentes, el 
segundo dígito puede solo ocurrir de una 1 sola forma 
(corresponde al dígito 3) y el tercer puede ocurrir de 7 formas 
por ser sin restitución, entonces por el principio de la 
multiplicación se tiene: 


8 


1 


El total de números que se pueden formar, de tal manera que 
el número 3 se encuentre en el centro es dado por la 
multiplicación de 8x1x7=56. 

5. En una reunión asisten 4 varones y 6 mujeres se elige 4 
personas sin tomar en cuenta el orden y sin restitución, cuantos 
grupos de personas se pueden formar en los siguientes casos: 

a. Todos los posibles grupos que se pueden formar. 



10 ! 

4!*6! 


= 210 
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b. Todos los posibles grupos en la cual existan 3 varones y 1 
mujer. 

c 4 *C 6 = 24 

3 1 

c. Todos los posibles grupos en la cual existan 2 varones y 2 
mujeres. 

C 4 *C 6 = 90 

2 2 

d. Todos los posibles grupos en la cual dos personas no 
aparezcan juntas 

CiO- 1 *C 8 = 2 1 0- 28= 182 

4 2 

6. En una urna contiene 2 bolitas rojas, 1 verde y 1 negra, se eligen 
4 bolitas sin reemplazo. Determinar el total de grupo a formarse 



(2!)(1!)(1!) 


9.4. Ejercicios propuestos 

1. Sean los dígitos {0,1,2, 3,4, 5, 6, 7, 8, 9}, se eligen 4dígltos 
al azar y con reemplazo para formar un número. Hallar: 

a. ¿Cuántos números pares se pueden formar. 

b. ¿Cuántos números son mayores a 5000. 

c. ¿Cuántos números son menores que 7000. 

d. ¿Cuántos números son mayores a 3000 pero menor a 
8000. 

e. ¿Cuántos números son mayores a3500. 

f. ¿Cuántos números contienen al digito 5. 


2. En un estante existe 3 libros de historia, 4 de literatura y 2 de 
música, se eligen 2 libros sin reemplazo. Hallar todas las 
posibles combinaciones. 
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3. En una reunión asisten 5 varones y 3 damas, se elige 2 personas 
al azar. Hallar todas las posibles combinaciones. 

4. 

5. Un blbllotecólogo para codificar revistas científicas dispone de 

los siguientes dígitos >2,3,4,5,6,7,8,9} ^ cuantos 

de 4 dígitos se dispone en cada caso: 

a. Se toma en cuenta el orden y con reemplazo 

b. Se toma en cuenta el orden y sin reemplazo 

c. No se toma en cuenta el orden y sin reemplazo 


6. Un cliente del Banco de la Nación tiene la posibilidad de escoger 
4 de los siguientes 10 dígitos { 0,1,2,3,4,5,67,8,9} como clave 
de su tarjeta Multired, Hallar todas las posibles combinaciones 
bajos las siguientes restricciones: 

a. Esta permitido elegir un mismo digito( elección con 
reemplazo) 

b. No esta permitido elegir un mismo digito( elección sin 
reemplazo) 

c. Que el número elegido sea par( con reemplazo y sin 
reemplazo) 

d. Que el número elegido sea ¡mpar( con reemplazo y sin 
reemplazo) 

e. Que el número elegido sea superior a 5000( con 
reemplazo y sin reemplazo) 

f. Que el número elegido sea inferior a 5000( con reemplazo 
y sin reemplazo) 

g. Que el número elegido se encuentre entre 5000 y 8000( 
con reemplazo y sin reemplazo) 

h. Que el primer digito sea 4( con reemplazo y sin 
reemplazo) 

i. Que el último digito sea 4( con reemplazo y sin reemplazo) 

j. Que el segundo digito sea 0( con reemplazo y sin 
reemplazo) 

7. En una reunión de una prestigiosa empresa dedicada a la 
producción de llantas para automóviles asisten 12 varones y 8 
mujeres, después de acaloradas discusiones se desea formar 
una comisión para analizar la estrategias de ventas: Dicha 
comisión debe estar integrada por 5 personas. Hallar todas las 
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posibilidades de elegir a las 5 personas bajo las siguientes 
condiciones. 

a. Elegir a cualquiera de ellos 

b. Que todos sean del sexo varón 

c. Que todos sean del sexo mujer 

d. Que haya 3 varones y 2 mujeres 

e. Que una mujer presida el grupo 

f. Que un varón presida el grupo 

g. Que una mujer este excluida del grupo 

h. Que un varón este excluido del grupo 

8. En una urna hay 4 bolas blancas, 5 rojas y 3 amarillas, se 
selecciona en forma aleatoria 5 bolas, cuantas formas existen 
de elegir las 5 bajo las siguientes modalidades: 

a. 2 sean blancas y 3 de otro color, sin reemplazo y sin 
considerar el orden de extracción. 

b. 3 sean blancas y 2 de otro color, con reemplazo y sin 
considerar el orden de extracción 

c. 2 sean amarillas y 3 de otro color, con reemplazo y 
considerando el orden de extracción. 

9. Una persona para llegar a cierta ciudad tiene que hacer uso de 
los siguientes medios de transportes; tiene 3 líneas de ómnibus 
para llegar a determinado paradero y 4 líneas de ómnibus para 
llegar al paradero final. ¿De cuántas formas diferentes puede 
llegar al paradero final?. 

10. En una urna existen 4 bolas rojas y 3 bolas blancas, se elige al 
azar 3 bolas con reemplazo. ¿Cuántas formas diferentes existen 
de elegir las 3 bolas?. 

11. En un estante existen 5 libros de física de diferentes autores, 4 
de matemáticas de diferentes autores y 3 libros de químicas de 
diferentes autores. ¿ cuantas formas existen de elegir tres libros 
de diferentes materias?. 

12. De la pregunta anterior, Hallar las formas de elegir tres libros al 
azar con reemplazo. 

13. De la pregunta 10, Hallar las formas de elegir tres libros al azar 
sin reemplazo. 
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14. De la pregunta 10, Hallar las formas de elegir tres libros al azar 
sin con reemplazo, si un libro de física siempre debe aparecer en 
el centro. 

15. De la pregunta 10, Hallar las formas de elegir tres libros al azar 
con reemplazo, si un libro de física siempre debe aparecer en el 
centro. 

16. En una biblioteca concurren 50 alumnos, de los cuales 30 son 

varones, se eligen al azar 10 alumnos, de cuantas formas se 
pueden elegir 5 varones y 5 damas. 

17. Sean los dígitos { 1 , 2, 3, 4}, se eligen 3 dígitos 

sin reemplazo, cuántos número de tres cifras menor o Igual a 
231 se pueden formar 

18. En una biblioteca concurren 50 alumnos, de los cuales 30 son 
varones, se eligen al azar 10 alumnos, de cuantas formas se 
pueden elegir 6 varones y 4 damas. 
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CAPÍTULO 10 
PROBABILIDAD 


INTRODUCCIÓN 

En este capítulo se presentan las bases, para modelar situaciones 
donde interviene ¡ncertldumbre en la toma de decisión para un 
conjunto de datos observados. 

10.1. EXPERIMENTO ALEATORIO^ 

Es una operación física o Idealizada, cuyo resultado de la 
observación no se conoce con exactitud, hasta después que 
culmine el experimento. El experimento deja de ser aleatorio 
cuando este concluye y se observa el resultado. 

Ejemplos. 

=Eleglr dos bolitas de una urna que contiene 1 bolitas rojas y 
1 blancas. 

¿2 =Lanzar una moneda dos veces y observar su resultado 

£ 3 =Reglstra el tiempo (horas) de vida de un foco eléctrico y 
observar su resultado. 

£4 = Lanzar una moneda hasta que aparezca la primera cara. 

£5 = Registra el peso (Kg.) de un recién nacido. 

Características de un experimento aleatorio. 

a. Puede ser repetido Infinita veces, bajo las mismas 
condiciones 

b. Los resultados posibles de un experimento, se pueden 
conocer a priori; Es decir se puede enumerar todos los 
posibles resultados del experimento aleatorio. 

c. Para un experimento aleatorio es casi siempre posible 
establecer un modelo probabilístico. 
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10.2. ESPACIO MUESTRAL (Q) 

Es el conjunto de todos los posibles resultados de un 
experimento aleatorio y es denotado por (Í2) y al total de 
resultados se denota por n(Q) 

Ejemplos: 

£\ = Elegir dos bolitas de una urna que contiene 1 bolitas 
rojas y 1 bolitas blancas y anotar sus resultados. 

Qj= {RR,RB,BR,BB} 

¿2 = Lanzar una moneda dos veces y anotar sus resultados 

Q 2 = {(cc),(cs),(sc),(w)} 

£3 = registra el tiempo (horas) de vida de un foco eléctrico. 

n 3 = {t/t, / > o} 

£4 = lanzar una moneda hasta que aparezca la primera cara. 
Q 4 = {c, SC, SSC, SSSC , ¿XWC,...} 

£ 5 = Elegir a un recién nacido y registrar su peso (Kg.) 

Q 5 ={x/x = peso, 1.5 <x <4.1} 

10.3. TIPOS DE ESPACIO MUESTRAL: 

ESPACIO MUESTRAL DISCRETO 

Si el espacio muestral tiene un número finito o infinito 

numerable de elementos. 

Ejemplo : 

Son los espacios muéstrales ^ 1 ? y ^2 
ESPACIO MUESTRAL CONTINUO 

SI el espacio muéstral tiene un número infinito no numerable de 
elementos. 
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Ejemplos : 

Son los espacios muéstrales ^3 » ^4 ’ ^5 

10.4. EVENTOS O SUCESOS 

Es un subconjunto del espacio muéstral, o es el conjunto de 
todos posibles resultados que le Interesa en forma particular al 
Investigador. A los eventos se le representa por lo general con 
las primeras letras mayúsculas del abecedario o también con 
letra mayúscula acompañada con subíndice. 

Ejemplo : 

De los 5 espacios muéstrales anteriores se definen los 
siguientes eventos: 

A = Que el número de artículos sea mayor a 5. 

B = Obtener una cara en los dos lanzamiento. 

C = Que el tiempo de vida se encuentre entre 980 horas y 
1200 horas 

D = Que ocurra cara en el 5to. Lanzamiento. 

E = Que el peso del recién nacido se encuentre entre 2.5 y 3.4 
Kg. 

10.5. EVENTOS MUTUAMENTE EXCLUYENTES 

Sean A y B dos eventos definidos en el espacio muéstral Q , se 
dice que los eventos son mutuamente excluyentes, si y solo si, 
estos no pueden ocurrir simultáneamente; es decir si el evento 
“A” ocurre, y no ocurre el evento B 

(viceversa); se representa matemáticamente por: A n5 = $ 
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Ejemplo 

Lanzar un dado dos veces, sean los eventos 
A = Que la suma de sus puntos sean 7 
B = Que la suma de su puntos sean 11 

Luego los eventos A y B son mutuamente excluyentes; es decir 
si ocurre el evento A ya no ocurre el evento B, y viceversa. 

TIPOS DE EVENTOS 

10.6. EVENTOS SIMPLES 

Son aquellos eventos que tienen un solo elemento del espacio 
muestral 

Ejemplo 

£3 = Lanzar un dado dos veces. 


íu 

2,1 

3,1 

4,1 

5,1 6,1 

1,2 

2,2 

3,2 

4,2 

5,2 

6,2 

1,3 

2,3 

3,3 

4,3 

5,3 

6,3 

1,4 

2,4 

3,4 

4,4 

5,4 

6,4 

1,5 

2,5 

3,5 

4,5 

5,5 

6,5 

1,6 

2,6 

3,6 

4,6 

5,6 

6,6 


Sea el evento simple: 

A = Que la suma de los resultados sea 2= {(1,1)} 

10.7. EVENTOS COMPUESTOS 

Son aquellos, eventos que tienen mas de un elemento del 
espacio muestral 

Ejemplo 

Del ejemplo anterior del lanzamiento de dos dados 
A = Que la suma sea 7= {(3,4),(4,3),(2,5),(5,2)(6,1),(1,6)} 
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10.8. EVENTOS NULOS O VACIOS 

Son aquellos eventos que no tiene elementos del espacio 
muestral 

Del ejemplo anterior del lanzamiento de dos dados 
A = Que la suma seal3= { }=0 

10.9. EVENTOS IGUALMENTE PROBABLES: 

Dos o más eventos simples son Igualmente probables, si tienen 
la misma probabilidad de ocurrir. 

Elemplo-1 

Se lanza un dado dos veces, los 36 eventos simples de la 
forma ( x, y) son Igualmente probables; es decir cada evento 
simple tiene la misma oportunidad de ocurrir. 

E¡emplo -2 

Una urna contiene 8 bolas rojas y 2 bolas blancas, se elige una 
bola al azar, los eventos simples serán cada uno de los 
resultados posibles en este caso roja o blanca, notamos que la 
probabilidad de sacar bola roja es más probable que sacar bola 
blanca, entonces los eventos simples no son Igualmente 
probables. 

10.10. DEFINICIÓN CLÁSICA DE PROBABILIDAD 


Es la manera más antigua de calcular probabilidades de eventos 
Igualmente probables. 

Sea £, un experimento aleatorio, y O su espacio muestral, con 
Af(fi) resultados Igualmente probables. Sea A un eventos 

definido en S , con 

N(A) Resultados Igualmente probables; la probabilidad de 
que ocurra el evento A denotado umversalmente por P(A), es un 
número positivo definido por: 


P( A) 


n( A) 
n( Q) 


N °de elementosdel evento A 
N °de elementosdel espaciomuestrcil S 
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Ejemplo 1 

Del ejemplo de lanzar un dado dos veces, cual es la 
probabilidad de que la suma de sus resultados sea siete. 

Sea el evento A = La suma de los resultados de lanzar un 
dado dos veces sea siete. 

A = {(3,4),(4,3),(2,5),(5,2)(6,1),(1,6)} entonces n(A)=6 


Como N( S )=36, corresponde a todos los resultados posibles 
al lanzar un dado dos veces. 


_ N °de elementosdel evento A _ ® _ 
n(Q) N °de elementosdel espaciomuestral S 36 


= 0.1667 
6 


Interpretación: 

La Probabilidad de obtener la suma de los resultados 7 cuando 
se lanza un dado dos veces es 0.1667 o el 16.67%. 

Ejemplo 2 

A una reunión asisten 30 varones y 40 mujeres, se eligen a 10 
personas al azar sin reemplazo. Hallar las siguientes 
probabilidades: 

a) Elegir 6 varones y 4 mujeres 

b) Elegir por lo menos 4 varones 


Solución para (a) 


S = Todas las posibles formas de elegir 10 personas de un 
total de 70, sin reemplazo: 


n (fi) = q™ 


Sea el evento A de Interés, todas las formas posibles de elegir 
6 varones y 4 mujeres de un total de 70 personas, es dado 
por: 


232 







EsTADÍSTICa DESCRiptiva V pRoBABILIDAd pARa LAS CIENCIAS DE LA INFORMAciÓn CON El USO DEl SPSS 


N (A) — C 30 C 40 

6 4 

/ a \ 30s~i 40 

Luego P(A)= =0.1368 

n(Q) C Yo 

Solución para (b) 

Sea el evento B elegir por lo menos 4 varones, significa que 
en el grupo de 10 personas elegidas, deben haber 4 varones y 
6 mujeres; 5 varones y 5 mujeres; 6 varones y 4 mujeres; 7 
varones y 3 mujeres; 8 varones y 2 mujeres; 9 varones y 1 
mujeres o 10 varones. 


N(B) = c 4 30 c 6 40 + q 30 q 40 + q 30 q 40 ■+ q 30 f 40 + f 30 2 c 40 + g c 30 c 40 1 0 c 30 

n(B) 


P(B) = 


c 30 c 40 + c 30 c 40 +... + c 70 

. _ 4 6 5 5 10 _ 


n(Q) 




■ 30 - 


0.702052255 


10 


10.11. DEFINICION FRECUENCIA RELATIVA DE PROBABILIDAD 


SI un experimento aleatorio se repite n veces bajo las mismas 

condiciones y si BL A de esas veces que se repite el experimento 
ocurre el evento de Interés A. Luego la frecuencia relativa del 
evento A es: 



n 


En el límite de las veces que se repite el experimento, la 
probabilidad de ocurrencia del evento A es: 

Lim h A = Lim — = P(A) 

n—}oo 4 

n— »co 

La probabilidad, es el valor en el cual se estabiliza la frecuencia 
relativa del evento después de haber repetido un número grande 
de veces. 
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Ejemplo 

Suponiendo que en una garita de peaje transitan casi siempre 
durante el día 8,000 vehículos, de los cuales 4,000 son autos, 
2,500 son camiones y 1,500 corresponde a ómnibus. 


Tipos de vehículos 

Frecuencias 

Frecuencia relativa 

Autos 

4000 

0.5000 

Camiones 

2500 

0.3125 

Omnibus 

1500 

0.1875 

Total 

8000 

1.000 


a. ¿Cuál es la probabilidad de que pase por la garita de peaje un 
camión?. 

Sea el evento A = que pase un camión por la garita de peaje, 
luego: 


P(A) 


2500 

8000 


0.3125 


b. ¿Cuál es la probabilidad de que pase por la garita de peaje un 
camión o ómnibus?. 

Sea el evento B = que pase un camión o ómnibus por la garita 
de peaje, 


P(A) 


2500+1500 

8000 


10.12. DEFINICIÓN AXIOMATICA DE PROBABILIDAD 

Sea s , un experimento aleatorio y Í2 su espacio muestral 
asociado al experimento; sea A un evento de Interés definido en 
el espacio muestral, la probabilidad de que ocurra el evento A, es 
un número real positivo denotado por P(A), que cumple los 
siguientes axiomas: 


a. 0 < P{A ) < 1 

b. P(Q) = 1 
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c. Sean A x y A 2 eventos mutuamente excluyente 
definidos en S , entonces se cumple que: 

P(A l0 A 2 ) = P(A 1 u A 2 ) = P{A X ) + P(A 2 ) 

El axioma (c) se generaliza para más de dos eventos 
mutuamente excluyentes, siempre y cuando que sean 
excluyentes dos a dos. 

Los tres axiomas son las bases para los siguientes teoremas: 

1 . Si (f ), es el conjunto vacío, entonces la P {(¡)) = 0 
Demostración 

Sea A un evento definido en el espacio muestral Q , entonces 
se cumple que: Au (j) = A, pero A y (f), son eventos 
mutuamente excluyentes; es decir A r\ </>= </>, haciendo uso 
del axioma (c), se tiene que: 

P( A u (f )) = P( A) + P{(/) ) = P( A) P{(/) ) = 0 

2 . Sea un evento complemento del evento A t entonces se 
cumple que: 

P( A c ) = 1 - P( A) 

3. Sean A y B dos eventos definidos en el espacio muestral $ , 
suponqamos que AczB t entonces se cumple que: 

P(A)<P(B ) 

4. Sean A y B dos eventos cualesquiera definidos en el espacio 
muestral Q , entonces se cumple que, la probabilidad de que 
ocurra el evento A o el evento B o ambos a la vez A y B es dado 
por: 

P( A u B) = P( A) + P(B ) -P(Anfi) 
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Ejemplo 

Sean los dígitos: {l,2, 3, 4, 5, 6, 7, 8, 9}; se elige un dígito al azar. 
Calcular las siguientes probabilidades: 

a. Que el número elegido sea menor a 4 o superior a 7. 

b. Que el número elegido sea par o superior a 6. 

c. Que el número elegido no sea4 

Solución para (a) 


Sean los eventos A=que el numero elegido sea menor a 4 ; B= que el 
numero elegido sea superior a 7, luego: 


A ={1,2,3} 

B ={8,9,} 

Como los eventos A y B son mutuamente excluyentes, luego: 

P(Au B) = P(A) + P(B ) = 3 + 2 = 5 

9 9 9 


Solución para (b) 


Sean los eventos A=que el número elegido sea par; B=que el número 
elegido sea superior a 6, luego: 

A ={2,4, 6, 8,} 

B={7,8,9} 

Como los eventos A y B no son mutuamente excluyentes, luego: 

P( A u B) = P( A) + P(B ) - P( A nB) 


La Intercepción de A y B es 
A nB= {8} 

/>( A u B) = P(A) + P(B) -P(AnB) = 4 ± 3 - 

9 9 9 


Solución para (c) 


_ 6 _ 2 
9 3 


Sean los eventos A=que el número elegido sea 4 y su complemento 
A = que el número elegido no sea 4: 
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A ={4} 

P(A C ) = 1- P(A) = 1- 1 = 9 : = 8 

9 9 9 

10.13. PROBABILILIDAD CONDICIONAL 


Sea A y B dos eventos definidos en el espacio muestral Q . 
Supongamos que el evento B ya ocurrió. ¿Cuál es la probabilidad de 
que ocurra el evento A?. El valor de la probabilidad pedida se 
representa umversalmente por P(A / B), y es definida por: 


P(A/B) = 


P(AnB) 
P(B ) 


para P(B) > 0 


La P(A/B), cumple con los 3 axioma de probabilidad. 


Ejemplo : 


Un centro de Información tiene 11,590 revistas científicas, las cuales 
están clasificadas según la materia y su idioma. __ 


\ Materias 

Matemáticas 

Física 

Química 

Total 

Idiomas 





Inglés 

1200 

900 

850 

2950 

Portugués 

700 

1500 

900 

3100 

Español 

1000 

980 

1200 

3180 

Francés 

800 

970 

590 

2360 

Total 

3700 

4350 

3540 

11590 


Se elige una revista al azar y supongamos que la revista esta escrita 
en inglés, ¿cuál es la probabilidad de que sea de física?: 

Sean los eventos: 

A= revistas de física 
B= revistas escritas en inglés 
P(AnB) 


P(A/B) = 


P(B) 
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De la tabla: 


La probabilidad de que sea de física y escrito en Inglés: 


P(A n B ) 


900 

11590 


La probabilidad de que este escrito en Inglés: 


P(B) 


2950 

11590 


Luego: 
P(A/B ) = 


P{A n B) 
P(B ) 


900 

2950 


0.30508 


Otra forma de obtener este resultado: 

Como el evento B ya ocurrió, el espacio muestral original conformado 
por la 11,590 formas de elegir una revista con esas dos características 
se reduce a solo 2,950 revista escritas en Inglés, de las cuales 900 
están en Ingles, entonces: 

P(A/B) = - 900 -= 0.30508 
2950 

10.14. REGLA DE LA MULTIPLICACIÓN DE PROBABILIDADES 

De la probabilidad condicional 
P(An B ) 

P(A/S) =- -+P(AnB) = P(B)P(A/B) (1) 

P(B) 

También se tiene que la probabilidad de que ocurra el evento B 
suponiendo que ya ocurrió el evento A, es dado por: 

D , D , .. P(PnA) 

P(B / A) = - —> P(Br\A) = P{A)P{BI A) (2) 

P{ A) 

De 1 y 2 se tiene que: 

P(AnB) = P{B)P{ A / B) = P( A)P(B / A) 

Ejemplo 

Del ejemplo anterior, se eligen al azar y sin reemplazo dos revistas, 
calcular las siguientes probabilidades: 
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1. Que la primera revista sea de física y la segunda de física ( 
equivale decir también a que ambas sean de física) 

Sean los eventos: 

A=Elegir una revista de física 
B=Elegir una revista de física 


P(A n£) = P(A)P(B / A) = 4350 * 4349 = 0.140847539 

11590 11589 

También: 


C 


4350 


P(Ambas revistasseande física) = ~ = 0.140847539 

^2 

2 . Que la primera revista sea de física y la segunda de matemática 


Sean los eventos: 

A=Elegir una revista de física 
B=Elegir una revista de matemática 


P(Anfí) = P(A)P(B / A) = 4350 * 3700 = 0.11983 

11590 11589 


3. Del ejemplo anterior supongamos que se eligen tres revistas al 
azar y sin reemplazo, cual es la probabilidad de que la primera 
revista este en idioma inglés, la segunda en idioma inglés y la 
tercera en idioma español. 

Sean los eventos: 

A=Elegir la primera revista en idioma ingles 
B=Elegir la segunda revista en idioma ingles 
C=Elegir la tercera revista en idioma español 

P(AnSnC) = P{A)P(B / A)P(C / An B) = 2950 * 2949 * 3 180 - 001777 

11590 11589 11588 

10.15. REGLA DE LA MULTIPLICACIÓN PARA MAS DE DOS 
EVENTOS CUALESQUIERA 

Sea Aj, A 2 ,...,A n eventos definidos en el espacio muestral S , 

entonces la probabilidad de que ocurran todos estos eventos en ese 
orden es dato por: 
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P(A 1 nA 2 n,...,nA„)=P(A 1 )P(A 2 /A 1 )P(A 3 /A 1 nA 2 ),..., P{ A„/A,n A 2 ,... nA, 4 ) 

Con la condición deque P( A, n A 2 ,... n A„_j) > 0 

5. PARTICIÓN DEL ESPACIO MUESTRAL 
Sea A 1 ,A 2 ,...,A„ eventos mutuamente excluyentes definidos en el 

espacio muestral Q, entonces A 1 , A 2 A„ , constituyen una 
partición, si cumplen las siguientes condiciones: 

1. A¡ = (f) V,. 

2. A i nA j =(f> V,. 

3. AjU A 2 u... u A„) =Q 


A, 

a 2 

a 3 


K 


10.16. TEOREMA DE LA PROBABILIDAD TOTAL 

Sea Aj, A 2 ,...,A n una partición del espacio muestral, definimos en 

estas particiones otro evento tal como B, luego se cumple que: 



La probabilidad de que ocurra algún elemento de B es dado por: 

n 

P{B) = Y j P( a i nB) 

i= 1 
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Demostración: 

Del GRÁFICO: 

B - (Aj n B) u (A 2 n B) u... u (A„ n B ), por ser estas 
intercepciones (A,n.B) mutuamente excluyentes para V ; luego se 
cumple que: 

n 

P(B ) =P( A l nB)+P( A 2 n£) + ...P(5nA„) = 2 P(A,nB) 

i=\ 

10.17. TEOREMA DE BAYES 

Sea Aj, A 2 ,...,A„ una partición del espacio muéstral, definimos en 
esta partición otro evento B, entonces la probabilidad de que ocurra un 
evento A ( - suponiendo que ocurrió el evento B, es dado por: 


P(A/B) 

i 


P(A,r^B) P{A, )P(B / A,) 
P(B) P(B) 


P( A¡)P(B/ A¡) i =1,2,3,...n 

n 

AJPW/A,) 


Ejemplo 

Un fabricante de chompas produce en un día determinado 1000 
chompas; 300 son para varones, 250 para mujer y 450 para niños: La 
probabilidad de que una chompa de varón tenga falla en el tejido es de 
0.01, para mujer es de 0.025 y para niños es de 0.05; de la producción 
de ese día se elige una chompa al azar; Hallar las siguientes 
probabilidades: 

1. Que la chompa tenga falla 

2 . Que la chompa no tenga falla 

3. Supongamos que se elige una chompa y tiene falla. ¿Cual es la 
probabilidad de que sea de varón? 

De la información se tiene: 
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Sean los eventos: 

A, =chompa de varón 
A 2 =chompa de mujer 
A 3 =chompa de niño 
B = chompa con falla 


Del enunciado se tiene las siguientes probabilidades: 


P(A 1 ) = 
P(A 2 ) = 


P(A 3 ) = 


300 

1000 

250 

1000 

450 

1000 


0.3 

0.25 

0.45 


P(B/A l ) = 0.01 
P(B/A 2 ) = 0.025 
P{B / A 3 ) = 0.05 

La probabilidad pedida es: 

P(B) = P( A, )P(B / A,) + P(A 2 )P(B / A 2 ) + P( A 3 )P(B / A 3 ) 
P(B ) = 0.3 * 0.01+ 0.25* 0.025 + 0.45* 0.05 = 0.032 

Interpretación: 

Existe una probabilidad del 0.032 o 3.2% de elegir una chompa de la 
fábrica y que tenga falla. 

La probabilidad pedida es: 

P(B C ) = 1 - P(B ) =1 -0.032=0.968 o 96.8% 

La probabilidad pedida es: 

P(A / B) = P(A^B) P( A x )P(B! A x ) 0.3 * 0.01 Q QQ4 
1 P(B) P(B) 0.032 
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10.18. INDEPENDENCIA DE EVENTOS 

Sean A y B dos eventos definidos en el espacio muestral Q , se dice 
que el evento A es independiente del evento B, si la probabilidad de 
ocurrencia del evento A, no se ve afectado por la ocurrencia del evento 
B y viceversa; es decir, 

P(A/B) = P(A ) o P(B / A) = P(B) 

Por lo tanto, si los eventos A y B son independientes, entonces: 


P{de que ocurra los eventos Ay B en forma simul tan ea) = P( A y B) = P( A n B) 

= P{A).P{B) 

Teoremas 


Sean A y B dos eventos independientes definidos en Q , sean los 

eventos -A y B c S us complementos respectivamente, luego 
se cumplen los siguientes teoremas: 

1. P(A C íaB) — P(A c )P(B) 

2 . P(AnB c ) = P(A)P(B C ) 

3. P(A c r^B c ) = P(A c )P(B c ) 

Demostración de (3) 

A c CAZ? =( y AvjB) c Por la Ley de Morgan 

P( A c i^B c ) = P(A<j B) c =1-P(AuB)=1- P{ A) - P(B ) + P( A n B) 

P(A c r\B c )= 1- P( A) - P(B ) + P( A)P(B) 

P( A c n B c ) = (1- P( A)) - P(B)( \- P( A)) 

P( A c ía B c ) — (1- P( A))(l- P(B )) = P( A c )P(B C ) 
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Ejemplo 

Se tiene dos urnas la primera contiene dos bolas rojas y una bola 
blanca, la segunda urna contienen una bola roja y dos bolas blancas, 
se elige una bola de cada urna. ¿Cual es la probabilidad de ambas 
bolas sean del mismo color. 

M = Obteneruna bola roja = { R } 

N = Obteneruna bola blanca = {B } 

Por ser ambos eventos Independientes, luego: 

Sea el evento de Interés: 

A = {RR o BB} 

Pía ) = P({RR o BB }) = P(RR) + P(BB ) - P(R).P(R) + P(B).P(B) 

Por ser eventos mutuamente excluyentes y a la vez eventos 
Independientes, luego se tiene: 

2 112 4 

P( A) = P(R).P(R) + P(B).P(B) = _* _+ _* _= _= 0.44444 

3 3 3 3 9 

10.19. EJERCICIOS PROPUESTOS 

1. Una caja contiene 8 bolsas de detergentes marca A y 5 bolsas 
de detergente marca B, se extraen al azar y con reemplazo 4 
bolsas. ¿ Cuál es la probabilidad de que sean extraídas 3 bolsas 
del detergente A y 1 bolsa del detergente B? 

2. En una reunión asisten 12 varones y 8 damas, se selecciona al 
azar 5 personas. ¿Cuál es la probabilidad de que 3 sean damas. 

3. En una ciudad hay 3 vendedores de gas(A; B y C). Un día 5 
residentes llaman a un vendedor de gas. SI cada residente 
selecciona al azar al vendedor de gas. 

a. ¿Cuáles la probabilidad de que todos los vendedores de gas 
sean elegidos. 

b. ¿Cuál es la probabilidad de que solo 2 vendedores de gas 
sean elegidos. 
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c. ¿Cuál es la probabilidad de que solo vendedores de gas A y B 
sean elegidos. 

4. Se tienen los dígitos {1,2,3,4,5,6,7,8,9} , se elige 3 dígitos al azar 
y con reemplazo. Hallar las siguientes probabilidades: 

a. Que el número elegido sea par 

b. Que el número elegido sea Impar 

c. Que el número elegido sean mayor a 400 

d. Que el número elegido se encuentre entre 300 y 600 

e. Que el número elegido contenga al número 5 en el centro 

f. Que el número elegido contenga al número 5 al Inicio 

g. Que el número elegido contenga al número 5 al final 

5. Del ejemplo anterior Hallar las probabilidades para el caso de 
elegir los 3 dígitos al azar y sin reemplazo. 

6 . SI los dígitos {2,2,2,5,5,7,8}, se distribuyen al azar para formar un 
número de 7 cifras. ¿ Cuál es la probabilidad de que el numero 
formado se encuentren los dígitos 5 juntos?. 

7. Una caja contiene 4 focos malos y 6 buenos, se sacan dos a la 
vez, si se prueba uno de ellos y se encuentra que es malo:¿Cuál 
es la probabilidad de que el otro también sea malo? 

8 . En un hotel se hospedan 6 arequlpeños y 4 huanuqueño. Se 
elige en forma aleatoria a 3 personas del hotel. ¿Cuál es la 
probabilidad de que al menos un de ellos seaarequlpeño? 

9. El gerente de una tienda comercial de dedicada a la venta para 
varones, toma una muestra aleatoria de 200 clientes y lo 
organiza de acuerdo a la siguiente tabla de doble entrada, tal 
como se muestra: 


CLIENTES 

COMPRAN A 
CRÉDITO 

COMPRAN AL 
CONTADO 

TOTAL 

CON TARJETA 
DE CRÉDITOS 

80 

40 

120 

SIN TARJETA 
DE CRÉDITOS 

50 

60 

110 

TOTAL 

130 

100 

230 


a. ¿Cuál es probabilidad de que no tenga tarjeta de crédito o 
compre a crédito? 

b. ¿Cuál es la probabilidad de que tenga tarjeta de crédito y 
compre a crédito? 
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c. Si se sabe que tiene tarjeta de crédito. ¿Cuál es la 
probabilidad de que compre a crédito? 

d. Se seleccionan a 3 clientes a azar, sin reemplazo. ¿Cuál es 
la probabilidad de que al menos uno compre al contado? 

e. Se seleccionan a 3 clientes al azar con reemplazo.¿ Cuál es 
la probabilidad de que 2 tengan tarjetas de crédito? 

10. Una compañía de cerveza tiene dos lavadoras de botellas. La 
lavadora “A” procesa un 20% de todas las botellas utilizadas 
diariamente y rompe un 3% de las que lava. La lavadora “B” 
procesa las restantes y rompe un 4%. 

a. ¿Cuál es la probabilidad de que una botella lavada, 
seleccionada al azar este rota? 

b. Una botella lavada seleccionada al azar, está rota. ¿Cuál a 
probabilidad de que haya sido lavada en la lavadora “A”?. 

c. Una botella lavada seleccionada al azar, no está rota. ¿Cuál 
es la probabilidad de que haya sido lavada por la lavadora 
“A”? 

11. Una base de datos contiene 50 libros de física y 20 de química y 
30 de matemáticas, se eligen al azar 5 libros. Hallar las 
siguientes probabilidades. 

a. Que 3 sean de Matemática y 2 de Química. 

b. Que 2 sean de Química, 2 de Matemática y 1 de Física. 

c. Que los 5 sean de Matemática. 

d. Que 3 sean de Matemática y 2 de Física o los 5 sean de 
Matemática 

e. Que los 5 libros sean de Física o 5 sean de Química. 

f. Que los 5 sean de Matemática o 5 de Química o 5 de Física. 

12. Sean los dígitos: 1, 2, 3, 4, 5, 6, 7, 8, 9, se eligen tres dígitos al 
azar con reemplazo para formar un número. Cuál es la 
probabilidad de que el número formado sea par o mayor a 500. 

13. Una primera base de datos contiene 10 revistas de computación 
y 10 de física, otra segunda base contiene 8 de computación y 
12 de física. Se elige una revista de cada base de datos. Calcular 
las siguientes probabilidades. 

a. Que sean de la misma materia 

b. Que sean de diferentes materias 
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